ЛЕКЦИЯ 1. ВВЕДЕНИЕ В КОРПУСНУЮ ЛИНГВИСТИКУ

Save this PDF as:
 WORD  PNG  TXT  JPG

Размер: px
Начинать показ со страницы:

Download "ЛЕКЦИЯ 1. ВВЕДЕНИЕ В КОРПУСНУЮ ЛИНГВИСТИКУ"

Транскрипт

1 ЛЕКЦИЯ 1. ВВЕДЕНИЕ В КОРПУСНУЮ ЛИНГВИСТИКУ В.П. Захаров Санкт-Петербургский государственный университет

2 Лекция 1 Корпусная лингвистика 2 Понятие корпуса Лингвистический, или языковой, корпус текстов большой, представленный в электронном виде, унифицированный, структурированный, размеченный, филологически компетентный массив языковых данных, предназначенный для решения конкретных лингвистических задач.

3 Лекция 1 Корпусная лингвистика 3 Проанализируем Большой Электронный Унифицированный Структурированный Размеченный Филологически компетентный Предназначенный для

4 Лекция 1 Корпусная лингвистика 4 Словарные картотеки W.N. Francis. Language Corpora B.C. - In Directions in Corpus Linguistics: Proceedings of Nobel Symposium 82. Stockholm, 4-8 August 1991, ed. by Jan Svartvik. (Berlin & New York: Mouton de Gruyter, 1991)

5 Лекция 1 Корпусная лингвистика 5 Электронные библиотеки и их разнообразие Корпус латинских текстов Персей. Корпус текстов Ф. М. Достоевского. Электронная энциклопедия "Брокгауз и Ефрон". Фундаментальная электронная библиотека. Российская виртуальная библиотека. Библиотека М. Мошкова. Электронная библиотека Химического фак-та МГУ.. и т.д.

6 Лекция 1 Корпусная лингвистика 6 Корпус vs. электронная библиотека Тексты в корпусах рассматриваются прежде всего как образцы текстов. Тексты в электронных библиотеках, исходя из их назначения, правильнее всего называть произведениями со всеми характерными для них атрибутами. Лингвистический корпус текстов: образцы текстов лингвистическая разметка лингвостатистика репрезентативность языкового материала"условная" отбор языкового материала на основе критериев репрезентативности, лингвистической и историко-культурной значимости Электронная библиотека: полные тексты библиографические и историкокультурные элементы данных (если имеются) отсутствие статистики полнота текстов электронной библиотеки отбор текстов, определяемый выбором составителей библиотеки

7 Лекция 1 Корпусная лингвистика 7 Корпусная лингвистика Brown Corpus (1962). Корпусная лингвистика раздел компьютерной лингвистики, занимающийся разработкой общих принципов построения и использования лингвистических корпусов (корпусов текстов) с использованием компьютерных технологий.

8 Лекция 1 Корпусная лингвистика 8 Терминология (см. глоссарии Захаров, McEnery) Биграмма, N-грамма Выравнивание Коллокат Коллокация Коллигация Конкорданс Корпус Лемма Нормированная частота, ipm Парсер, парсинг Разметка, аннотация Токен, токенизация Тэг, тег, тэггер Частеречная разметка

9 Лекция 1 Корпусная лингвистика 9 Терминология (2) Alignment Annotation collocate collocation Concordance Corpus, corpora Corpus manager Disambiguation Lemmatization Parser, syntactic parser Parsing Part-of-speech tagging, POS tagger Query(ing) tools Tag, tagset Treebank

10 Лекция 1 Корпусная лингвистика 10 Корпус Собственно корпус (массив корпусных данных) + корпусный менеджер (специализированная поисковая система)

11 Лекция 1 Корпусная лингвистика 11 Лингвистические поисковые системы: корпусные менеджеры и конкордансеры поиск конкретных словоформ и вывод результатов в виде конкорданса; поиск словоформ по леммам; поиск группы словоформ в виде разрывной или неразрывной синтагмы; поиск словоформ по набору морфологических признаков; отображение информации о происхождении, типе текста и т.п.; вывод результатов поиска с указанием контекста заданной длины; получение различных лексико-грамматических статистических данных; сохранение отобранных строк конкорданса в отдельном файле на компьютере пользователя и др.

12 Лекция 1 Корпусная лингвистика 12 Конкорданс Конкорданс список контекстов, где искомая единица представлена в ее лексическом окружении и характеризуется набором статистических данных. В простейшем случае представляет собой алфавитный список слов в тексте с теми контекстами, в которых они встречались. Пример конкорданса (KWIC Key Word In Context) для слова poor : taste it is that such poor cattle always have in their mouths of sparing the poor child the inheritance of any part of small property of my poor father, whom I never saw--so long desolate, while your poor heart pined away, weep for it Miss, if the poor lady had suffered so intensely the love of my poor mother hid his torture from me

13 Лекция 1 Корпусная лингвистика 13 От конкордансеров к корпусным менеджерам Простой конкордансер может построить конкорданс отдельных слов, словосочетаний, частей слов, знаков пунктуации и т.д. в контекстном окружении. Но более сложные программы способны строить полные конкордансы, включающие в себя не только слова, но и другие элементы корпуса. Это лемма и морфологические характеристики слова; позиция слова в предложении и в структуре размеченного текста (HTML, XML); библиографические и типологические признаки документа, из которого выбран контекст (автор, название, источник, год издания, тип текста и т.д.); статистические данные и многое другое. Программы такого рода получили название corpus manager.

14 Лекция 1 Корпусная лингвистика 14 Корпусные менеджеры Корпусным менеджером (или корпусменеджером) (англ. corpus manager) называют специализированную поисковую систему управления текстовыми и лингвистическими данными, которая включает программные средства для поиска в корпусе, получения статистической информации и предоставления результатов пользователю в удобной форме. Bonito; CQP; DDC; WebCorp; Xaira...

15 Поиск в Интернет ПОИСКОВЫЕ СИСТЕМЫ СЕТИ ИНТЕРНЕТ КАК КОРПУСНЫЕ МЕНЕДЖЕРЫ. СПЕЦИАЛИЗИРОВАННЫЕ КОРПУСНЫЕ ИНТЕРФЕЙСЫ К ИНДЕКСАМ ГЛОБАЛЬНЫХ ПОИСКОВЫХ СИСТЕМ См. Лекция 1а.

16 Лекция 1 Корпусная лингвистика 16 Создание и использование корпусов Назначение языкового корпуса показать функционирование лингвистических единиц в их естественной контекстной среде. На основе корпуса можно получить данные: о частоте словоформ, лексем, грамматических категорий; об изменениях частот; об изменениях контекстов в различные периоды времени; о поведении языковых единиц разных авторов; о совместной встречаемости лексических единиц; об особенностях их сочетаемости, управления; и т.д.

17 Лекция 1 Корпусная лингвистика 17 Репрезентативность и сбалансированность Размеры и процентные соотношения: Жанры Стили Периоды Авторы Хронологические границы Объём: 1 млн. с/у 100 млн. 1 млрд. 100 млрд.??

18 Лекция 1 Корпусная лингвистика 18 Область ( domain ) в BNC imaginative (21.91%) arts (8.08%) belief and thought (3.40%) commerce/finance (7.93%) leisure (11.13) natural/pure science (4.18%) applied science (8.21%) social science (14.80%) world affairs (18.39%) unclassified (1.93%) Стоит ли разделить commerce/finance? Почему commerce/finance представлены в большей мере, чем arts? Стоит ли не выделить отдельную область для поэзии?

19 Лекция 1 Корпусная лингвистика 19 Источник ( medium ) в BNC book (55.58%) periodical (31.08%) misc. published (4.38%) misc. unpublished (4%) to-be-spoken (1.52%) unclassified (0.4%) Почему книг больше, чем периодики? Что многочисленнее? Почему маленький процент unpublished?.

20 Лекция 1 Корпусная лингвистика 20 Создание корпуса Проектирование Обеспечение поступления текстов в соответствии с перечнем источников Подготовка «технологического» описания Преобразование в машиночитаемую форму Конвертирование и предварительная обработка текстов Графематический анализ (токенизация) Метаразметка Лингвистическая разметка Корректировка результатов автоматической разметки Загрузка размеченных текстов в структуру корпусменеджера Обеспечение доступа к корпусу (поиск) Создание документационного обеспечения

21 Лекция 1 Корпусная лингвистика 21 Developing Linguistic Corpora: a Guide to Good Practice / Edited by Martin Wynne Preface Martin Wynne (AHDS Literature, Languages and Linguistics, University of Oxford, UK) Chapter 1 Corpus and Text: Basic Principles John Sinclair (Tuscan Word Centre) Chapter 2 Adding Linguistic Annotation Geoffrey Leech (Lancaster University) Chapter 3 Metadata for Corpus Work Lou Burnard (University of Oxford) Chapter 4 Character Encoding in Corpus Construction Anthony McEnery and Richard Xiao (Lancaster University) Chapter 5 Spoken Language Corpora Paul Thompson (University of Reading) Chapter 6 Archiving, Distribution and Preservation Martin Wynne (University of Oxford) Appendix to chapter one: How to make a corpus John Sinclair (Tuscan Word Centre) Bibliography

22 Лекция 1 Корпусная лингвистика 22 Разметка Англ.: tagging, annotation. Разметка приписывание текстам и их компонентам специальных меток. Виды разметки: экстралингвистическая (метаразметка) сведения об авторе и сведения о тексте: автор, название, год и место издания, жанр, тематика; структурная (глава, абзац, предложение, словоформа) собственно лингвистическая

23 Лекция 1 Корпусная лингвистика 23 Лингвистическая разметка 1. морфологическая разметка part-of-speech tagging (POS-tagging) 2. синтаксическая разметка 3. семантическая разметка 4. анафорическая разметка 5. просодическая разметка и т.д.

24 Лекция 1 Корпусная лингвистика 24 Типы корпусов Корпусы, относящиеся ко всему языку; корпусы, относящиеся к какому-либо подъязыку (жанр, стиль, язык определенной возрастной или социальной группы, язык писателя или ученого и т.п.). Существует большое число разных других типов корпусов. Можно выделить различные основания для классификации корпусов.

25 Лекция 1 Корпусная лингвистика 25 Пользователи Прикладные лингвисты; лексикографы; лингвисты-теоретики; преподаватели; компьютерные лингвисты; другие специалисты по языку (литературоведы, редакторы); специалисты по общественным наукам (историки, социологи); корпусы как инструмент для разработки и настройки различных автоматизированных систем (машинный перевод, распознавание речи, информационный поиск).

Корпус текстов как особый лингвистический ресурс

Корпус текстов как особый лингвистический ресурс Корпус текстов как особый лингвистический ресурс Содержание 1 Понятие и основные характеристики корпуса текстов 1.1 Размер и репрезентативность 1.2 Разметка 2 Виды разметки в корпусе 3 Основные этапы создания

Подробнее

Рабочая программа дисциплины «Корпусная лингвистика и перевод» Направление подготовки. Магистерская программа

Рабочая программа дисциплины «Корпусная лингвистика и перевод» Направление подготовки. Магистерская программа МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования «Кемеровский государственный университет» Факультет

Подробнее

"Корпусная лингвистика"

Корпусная лингвистика ПРОГРАММА УЧЕБНОЙ ДИСЦИПЛИНЫ "Корпусная лингвистика" I. ОРГАНИЗАЦИОННО-МЕТОДИЧЕСКИЙ РАЗДЕЛ 1. Цель курса состоит в том, чтобы познакомить студентов с концепциями корпусной лингвистики, дать им возможность

Подробнее

ПАРАЛЛЕЛЬНЫЙ РУССКО-СЛОВАЦКИЙ КОРПУС

ПАРАЛЛЕЛЬНЫЙ РУССКО-СЛОВАЦКИЙ КОРПУС ПАРАЛЛЕЛЬНЫЙ РУССКО-СЛОВАЦКИЙ КОРПУС Радован Гарабик Виктор Захаров In: Tруды международной конференции Корпусная лингвистика 2006. Sankt-Petersburg: St. Petersburg University Press 2006, s. 81 87. ISBN

Подробнее

Программы для работы с корпусами текстов: Е.В. Недошивина Санкт-Петербургский государственный университет Санкт-Петербург

Программы для работы с корпусами текстов: Е.В. Недошивина Санкт-Петербургский государственный университет Санкт-Петербург Программы для работы с корпусами текстов: обзор основных корпусных менеджеров. работа с системой DDC Е.В. Недошивина Санкт-Петербургский государственный университет Санкт-Петербург Введение В настоящее

Подробнее

Программа учебной дисциплины Корпусные исследования в современной лингвистике

Программа учебной дисциплины Корпусные исследования в современной лингвистике Программа учебной дисциплины Корпусные исследования в современной лингвистике Для обучающихся по основной образовательной программе подготовки магистров 03700.68 Филология Количество зачетных единиц 3

Подробнее

ФОРУМ МОЛОДЫХ УЧЕНЫХ 4(4)

ФОРУМ МОЛОДЫХ УЧЕНЫХ 4(4) УДК 81-133 Лабачёва Маргарита Васильвна студентка 2 курса Армавирский Государственный Педагогический Университет Институт Русской и Иностранной Филологии Россия, г. Армавир Научные руководители: Гурова

Подробнее

Введение в корпусную лингвистику

Введение в корпусную лингвистику Введение в корпусную лингвистику 1 Предмет корпусной лингвистики. Сопоставление корпусной и традиционной лингвистики 2 История создания лингвистических корпусов 3 Типология корпусов Литература ØБаранов

Подробнее

Захаров В.П., Хохлова М.В.

Захаров В.П., Хохлова М.В. Захаров В.П., Хохлова М.В. Анализ эффективности статистических методов выявления коллокаций в текстах на русском языке Санкт-Петербургский государственный университет vz1311@yandex.ru, khokhlova.marie@gmail.com

Подробнее

ИНФОРМАЦИОННАЯ СТРУКТУРА НАУЧНОГО ТЕКСТА. ТЕКСТ В КОНТЕКСТЕ КОЛЛЕКЦИИ

ИНФОРМАЦИОННАЯ СТРУКТУРА НАУЧНОГО ТЕКСТА. ТЕКСТ В КОНТЕКСТЕ КОЛЛЕКЦИИ Л.М. Пивоварова, Е.В. Ягунова (СПбГУ) Информационная структура научного текста. Текст в контексте коллекции // Труды международной конференции «Корпусная лингвистика 2011». СПб.: С.-Петербургский гос.

Подробнее

ТЕКСТОВ ИНТЕРВЬЮ КАК ИНСТРУМЕНТ ЛИНГВОКУЛЬТУРОЛОГИЧЕСКОГО ИССЛЕДОВАНИЯ

ТЕКСТОВ ИНТЕРВЬЮ КАК ИНСТРУМЕНТ ЛИНГВОКУЛЬТУРОЛОГИЧЕСКОГО ИССЛЕДОВАНИЯ «Magister Dixit» - научно-педагогический журнал Восточной Сибири 2 (06). Июнь 2012 (http://md.islu.ru/) УДК 81'33 ББК 81.1 А.Д. Кожевникова Иркутск, Россия КОРПУС ТЕКСТОВ ИНТЕРВЬЮ КАК ИНСТРУМЕНТ ЛИНГВОКУЛЬТУРОЛОГИЧЕСКОГО

Подробнее

Автоматическая обработка текста Автоматический (машинный) перевод Автоматический графематический анализ Автоматический морфологический анализ

Автоматическая обработка текста Автоматический (машинный) перевод Автоматический графематический анализ Автоматический морфологический анализ Глоссарий Автоматическая обработка текста комплекс методов компьютерного преобразования письменного или устного текста, основанных на многоуровневом автоматическом анализе и синтезе речи; в узком смысле

Подробнее

КОРПУСНАЯ ЛИНГВИСТИКА И ПЕРЕВОД: ПОТЕНЦИАЛ И ОГРАНИЧЕНИЯ

КОРПУСНАЯ ЛИНГВИСТИКА И ПЕРЕВОД: ПОТЕНЦИАЛ И ОГРАНИЧЕНИЯ 86 КОРПУСНАЯ ЛИНГВИСТИКА И ПЕРЕВОД: ПОТЕНЦИАЛ И ОГРАНИЧЕНИЯ Л.Н. Беляева Одним из направлений использования электронных ресурсов вообще и корпусной лингвистике в частности является создание автоматизированных

Подробнее

КОРПУС ПАРАЛЛЕЛЬНЫХ ТЕКСТОВ В ОБУЧЕНИИ ИНОСТРАННОМУ ЯЗЫКУ

КОРПУС ПАРАЛЛЕЛЬНЫХ ТЕКСТОВ В ОБУЧЕНИИ ИНОСТРАННОМУ ЯЗЫКУ ISSN 1810-0201. Вестник ТГУ, выпуск 2 (118), 2013 УДК 811.111 КОРПУС ПАРАЛЛЕЛЬНЫХ ТЕКСТОВ В ОБУЧЕНИИ ИНОСТРАННОМУ ЯЗЫКУ Анастасия Александровна КОКОРЕВА Тамбовский государственный университет им. Г.Р.

Подробнее

Введение. Обработка естественного языка, или компьютерная лингвистика

Введение. Обработка естественного языка, или компьютерная лингвистика Введение. Обработка естественного языка, или компьютерная лингвистика Компьютерные методы анализа текста Кирилл Александрович Маслинский НИУ ВШЭ Санкт-Петербург 16.01.2013 / 01 Outline Задачи курса Предмет

Подробнее

Майнор «Лингвистика»

Майнор «Лингвистика» Федеральное государственное автономное образовательное учреждение высшего профессионального образования "Национальный исследовательский университет "Высшая школа экономики" Факультет гуманитарных наук

Подробнее

Фонд оценочных средств для проведения промежуточной аттестации обучающихся по дисциплине:

Фонд оценочных средств для проведения промежуточной аттестации обучающихся по дисциплине: М.2.Б.2 Квантитативная лингвистика и новые информационные технологии Фонд оценочных средств для проведения промежуточной аттестации обучающихся по дисциплине: Общие сведения 1. Кафедра Иностранных языков

Подробнее

Автоматическое извлечение правил для снятия морфологической неоднозначности

Автоматическое извлечение правил для снятия морфологической неоднозначности Автоматическое извлечение правил для снятия морфологической неоднозначности Екатерина Протопопова, Виктор Бочаров СПбГУ, Санкт-Петербург, Россия, protoev@gmail.com, victor.bocharov@gmail.com Аннотация.

Подробнее

Ключевые слова: Интернет, тувиноведение, обзор, тувинский язык, сайт, прикладная лингвистика

Ключевые слова: Интернет, тувиноведение, обзор, тувинский язык, сайт, прикладная лингвистика Тувиноведение в Интернете Электронный корпус текстов тувинского языка А. Я. Салчак Аннотация: Текст статьи был представлена на Международной научнопрактической конференции, посвященной 100-летию со дня

Подробнее

ВЕБ-ПРОСТРАНСТВО КАК ЯЗЫКОВОЙ КОРПУС THE WORLD WIDE WEB AS LINGUISTIC CORPUS

ВЕБ-ПРОСТРАНСТВО КАК ЯЗЫКОВОЙ КОРПУС THE WORLD WIDE WEB AS LINGUISTIC CORPUS ВЕБ-ПРОСТРАНСТВО КАК ЯЗЫКОВОЙ КОРПУС THE WORLD WIDE WEB AS LINGUISTIC CORPUS В. П. Захаров vz1311@yandex.ru Кафедра математической лингвистики, Филологический факультет, Санкт-Петербургский государственный

Подробнее

Каждое второе слово. Вместо введения

Каждое второе слово. Вместо введения Вместо введения Каждое второе слово Настоящее учебное пособие представляет собой англо-русский словарь, включающий в себя описание только 135 английских слов. Слова эти особые: по частоте употребления

Подробнее

ПЕРЕВОДЧЕСКИЕ КОРПУСЫ ЧТО ОНИ МОГУТ СКАЗАТЬ НАМ О ПЕРЕВОДЕ И ЕГО ПРЕПОДАВАНИИ?

ПЕРЕВОДЧЕСКИЕ КОРПУСЫ ЧТО ОНИ МОГУТ СКАЗАТЬ НАМ О ПЕРЕВОДЕ И ЕГО ПРЕПОДАВАНИИ? УДК 81'32 В.И. Мельник Санкт-Петербургский государственный университет ПЕРЕВОДЧЕСКИЕ КОРПУСЫ ЧТО ОНИ МОГУТ СКАЗАТЬ НАМ О ПЕРЕВОДЕ И ЕГО ПРЕПОДАВАНИИ? В настоящей статье речь идет о специализированных корпусах

Подробнее

ИССЛЕДОВАНИЕ КОНТЕКСТНОЙ ПРЕДСКАЗУЕМОСТИ ЕДИНИЦ ТЕКСТА С ПОМОЩЬЮ КОРПУСНЫХ РЕСУРСОВ 1

ИССЛЕДОВАНИЕ КОНТЕКСТНОЙ ПРЕДСКАЗУЕМОСТИ ЕДИНИЦ ТЕКСТА С ПОМОЩЬЮ КОРПУСНЫХ РЕСУРСОВ 1 ИССЛЕДОВАНИЕ КОНТЕКСТНОЙ ПРЕДСКАЗУЕМОСТИ ЕДИНИЦ ТЕКСТА С ПОМОЩЬЮ КОРПУСНЫХ РЕСУРСОВ 1 Е.В. Ягунова Во время коммуникативного акта человек непрерывно планирует (программирует) свою речевую деятельность,

Подробнее

КОРПУСНЫЕ ТЕХНОЛОГИИ В РЕЖИМЕ ДИАЛОГА «ПРЕПОДАВАТЕЛЬ СТУДЕНТ-ИССЛЕДОВАТЕЛЬ»

КОРПУСНЫЕ ТЕХНОЛОГИИ В РЕЖИМЕ ДИАЛОГА «ПРЕПОДАВАТЕЛЬ СТУДЕНТ-ИССЛЕДОВАТЕЛЬ» C.C. Дикарева КОРПУСНЫЕ ТЕХНОЛОГИИ В РЕЖИМЕ ДИАЛОГА «ПРЕПОДАВАТЕЛЬ СТУДЕНТ-ИССЛЕДОВАТЕЛЬ» 1. Идеология корпусной лингвистики В докладе рассматривается роль корпусных технологий в теории языка и в практических

Подробнее

Цель проекта. изучение корпусов Марка Дэвиса с точки зрения практического использования корпусных технологий в деятельности лингвиста

Цель проекта. изучение корпусов Марка Дэвиса с точки зрения практического использования корпусных технологий в деятельности лингвиста Цель проекта изучение корпусов Марка Дэвиса с точки зрения практического использования корпусных технологий в деятельности лингвиста изучить подкорпуса английского и испанского языков; Задачи проекта провести

Подробнее

ПРОГРАММНЫЙ ИНСТРУМЕНТАРИЙ РАЗРАБОТКИ ЛИНГВИСТИЧЕСКИХ РЕСУРСОВ. Загорулько М.Ю., Сидорова Е.А.

ПРОГРАММНЫЙ ИНСТРУМЕНТАРИЙ РАЗРАБОТКИ ЛИНГВИСТИЧЕСКИХ РЕСУРСОВ. Загорулько М.Ю., Сидорова Е.А. УДК 004.912 ПРОГРАММНЫЙ ИНСТРУМЕНТАРИЙ РАЗРАБОТКИ ЛИНГВИСТИЧЕСКИХ РЕСУРСОВ Загорулько М.Ю., Сидорова Е.А. Институт систем информатики им. А.П. Ершова Сибирского отделения Российской академии наук, г. Новосибирск,

Подробнее

Математические модели в лингвистике

Математические модели в лингвистике Математические модели в лингвистике 10. Измерение расстояний между корпусами текстов Мати Пентус, Александр Пиперски, Алексей Сорокин МГУ, межфакультетский курс, осенний семестр 2017 2018 учебного года

Подробнее

Магистрант: Бименова Жанат Батырбековна Научный руководитель: к.ф.-м.н. Сидорова Елена Анатольевна

Магистрант: Бименова Жанат Батырбековна Научный руководитель: к.ф.-м.н. Сидорова Елена Анатольевна Магистрант: Бименова Жанат Батырбековна Научный руководитель: к.ф.-м.н. Сидорова Елена Анатольевна Разработка методов и средств автоматизации построения тезаурусов предметных областей 1 Цели работы Разработка

Подробнее

СЛОВАРНАЯ КАРТОТЕКА ИНСТИТУТА ЛИНГВИСТИЧЕСКИХ ИССЛЕДОВАНИЙ РАН КАК ОБЪЕКТ АВТОМАТИЗАЦИИ 1 DICTIONARY CARD FILES AS AN OBJECT FOR AUTOMATION

СЛОВАРНАЯ КАРТОТЕКА ИНСТИТУТА ЛИНГВИСТИЧЕСКИХ ИССЛЕДОВАНИЙ РАН КАК ОБЪЕКТ АВТОМАТИЗАЦИИ 1 DICTIONARY CARD FILES AS AN OBJECT FOR AUTOMATION Труды международной конференции Диалог 2007 СЛОВАРНАЯ КАРТОТЕКА ИНСТИТУТА ЛИНГВИСТИЧЕСКИХ ИССЛЕДОВАНИЙ РАН КАК ОБЪЕКТ АВТОМАТИЗАЦИИ 1 DICTIONARY CARD FILES AS AN OBJECT FOR AUTOMATION Захаров В.П. (vz1311@yandex.ru)

Подробнее

«Острова надежности» в русской спонтанной речи 1

«Острова надежности» в русской спонтанной речи 1 Е.И. Риехакайнен Санкт-Петербургский государственный университет «Острова надежности» в русской спонтанной речи 1 Многочисленные исследования спонтанной речи, проведенные на материале русского и других

Подробнее

ИНТЕГРАЦИЯ МОРФОАНАЛИЗАТОРОВ ДЛЯ АННОТАЦИИ РУССКОЯЗЫЧНЫХ КОРПУСОВ ТЕКСТОВ

ИНТЕГРАЦИЯ МОРФОАНАЛИЗАТОРОВ ДЛЯ АННОТАЦИИ РУССКОЯЗЫЧНЫХ КОРПУСОВ ТЕКСТОВ П.В. Паничева, О.А. Митрофанова ИНТЕГРАЦИЯ МОРФОАНАЛИЗАТОРОВ ДЛЯ АННОТАЦИИ РУССКОЯЗЫЧНЫХ КОРПУСОВ ТЕКСТОВ Морфологическая аннотация русских корпусов и разрешение морфологической неоднозначности задачи,

Подробнее

КОРПуСНАЯ ЛИНГВИСТИКА

КОРПуСНАЯ ЛИНГВИСТИКА Министерство образования Республики Беларусь Учебно-методическое объединение по гуманитарному образованию Х.У ГВёРЖДАЮ, - }Іерізьій заместитель Министра образования Ьел ару с ь А. И. Жук Рсч йс'і^^анйонный

Подробнее

Выводы Науч. рук. к.т.н., доц. Звенигородский А.С. Определение биграмм на материале научных текстов по извлечению данных из текстов

Выводы Науч. рук. к.т.н., доц. Звенигородский А.С. Определение биграмм на материале научных текстов по извлечению данных из текстов Рис. 3. Пример сдвига на две позиции Выводы Рассмотренные методы позволяют совершенствовать технологию формирования растровых стереоизображений, а разработанный плагин дает возможность ускорения этого

Подробнее

СИСТЕМА СЛОЖНОГО МОРФОЛОГИЧЕСКОГО ПОИСКА В ПИСЬМЕННОМ КОРПУСЕ ТАТАРСКОГО ЯЗЫКА

СИСТЕМА СЛОЖНОГО МОРФОЛОГИЧЕСКОГО ПОИСКА В ПИСЬМЕННОМ КОРПУСЕ ТАТАРСКОГО ЯЗЫКА СИСТЕМА СЛОЖНОГО МОРФОЛОГИЧЕСКОГО ПОИСКА В ПИСЬМЕННОМ КОРПУСЕ ТАТАРСКОГО ЯЗЫКА М. Р. Сайхунов, Р. Р. Хусаинов, Т. И. Ибрагимов Казань Аннотация. Работа посвящена описанию современного состояния Письменного

Подробнее

Обзор современных лингвистических технологий и систем

Обзор современных лингвистических технологий и систем УДК 004.023 Обзор современных лингвистических технологий и систем К.И. Якубовский, К.А. Якубовская Московский государственный университет печати имени Ивана Федорова 127550, Москва, ул. Прянишникова, 2А

Подробнее

ТЕЗАУРУСНОЕ МОДЕЛИРОВАНИЕ ПРЕДМЕТНОЙ ОБЛАСТИ «КОРПУСНАЯ ЛИНГВИСТИКА» НА МАТЕРИАЛЕ АНГЛИЙСКОГО ЯЗЫКА

ТЕЗАУРУСНОЕ МОДЕЛИРОВАНИЕ ПРЕДМЕТНОЙ ОБЛАСТИ «КОРПУСНАЯ ЛИНГВИСТИКА» НА МАТЕРИАЛЕ АНГЛИЙСКОГО ЯЗЫКА УДК 81 1 2009 ТЕЗАУРУСНОЕ МОДЕЛИРОВАНИЕ ПРЕДМЕТНОЙ ОБЛАСТИ «КОРПУСНАЯ ЛИНГВИСТИКА» НА МАТЕРИАЛЕ АНГЛИЙСКОГО ЯЗЫКА Т.Н. Сергеева, старший преподаватель кафедры «Теория и методика преподавания иностранных

Подробнее

ОСОБЕННОСТИ ФУНКЦИОНИРОВАНИЯ ИНТЕЛЛЕКТУАЛЬНОЙ ПОИСКОВОЙ СИСТЕМЫ

ОСОБЕННОСТИ ФУНКЦИОНИРОВАНИЯ ИНТЕЛЛЕКТУАЛЬНОЙ ПОИСКОВОЙ СИСТЕМЫ М.А. Шумская (Минск, МГЛУ) ОСОБЕННОСТИ ФУНКЦИОНИРОВАНИЯ ИНТЕЛЛЕКТУАЛЬНОЙ ПОИСКОВОЙ СИСТЕМЫ Современные информационно-поисковые системы, работающие с запросами пользователя в виде ключевых слов, характеризуются

Подробнее

Характеристика профессиональной деятельности выпускников

Характеристика профессиональной деятельности выпускников х> \ университет /s^ // ' ^Ч ft// УТВЕРЖДАЮ по учебной работе А.Б. Безбородов «Ж> OG 2016 г. Аннотация основной образовательной программу высшего профессионального образования по напрэдшжшо подготовки

Подробнее

Методы анализа текста и дискурса

Методы анализа текста и дискурса Методы анализа текста и дискурса Стефан Тичер, Майкл Мейер, Рут Водак, Ева Веттер Гуманитарный Центр Харьков 2009 УДК 80.81'42 ББК 81.2-5 Т 54 Перевод и научная редакция кандидата филологических наук Анны

Подробнее

КОРПУСНАЯ ЛИНГВИСТИКА

КОРПУСНАЯ ЛИНГВИСТИКА МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РФ ГОУ ВПО «Иркутский государственный лингвистический университет» В.П. Захаров, С.Ю. Богданова КОРПУСНАЯ ЛИНГВИСТИКА Учебник Иркутск ИГЛУ 2011 УДК 81 32 ББК 81.1-923 З

Подробнее

Как собрать репрезентативный подкорпус на основе данных о распределении слов

Как собрать репрезентативный подкорпус на основе данных о распределении слов Тезисы СКИЛ217 Шаврина Татьяна Шаврина Татьяна Олеговна rybolos@gmail.com 8916867341 НИУ ВШЭ, 1 курс магистратуры Генеральный интернет-корпус русского языка Как собрать репрезентативный подкорпус на основе

Подробнее

ЖУРНАЛ РАДИОЭЛЕКТРОНИКИ, N 10, 2010 ПРИМЕНЕНИЕ КОНТЕКСТНЫХ ВЕКТОРОВ В КЛАССИФИКАЦИИ ТЕКСТОВЫХ ДОКУМЕНТОВ. Получена 27 сентября 2010 г.

ЖУРНАЛ РАДИОЭЛЕКТРОНИКИ, N 10, 2010 ПРИМЕНЕНИЕ КОНТЕКСТНЫХ ВЕКТОРОВ В КЛАССИФИКАЦИИ ТЕКСТОВЫХ ДОКУМЕНТОВ. Получена 27 сентября 2010 г. УДК 004.93'1 ПРИМЕНЕНИЕ КОНТЕКСТНЫХ ВЕКТОРОВ В КЛАССИФИКАЦИИ ТЕКСТОВЫХ ДОКУМЕНТОВ А.С. Епрев Омский государственный университет им. Ф.М. Достоевского Получена 27 сентября 2010 г. Аннотация. В работе представлен

Подробнее

Правительство Российской Федерации

Правительство Российской Федерации Правительство Российской Федерации Федеральное государственное автономное образовательное учреждение высшего профессионального образования «Национальный исследовательский университет Высшая школа экономики»

Подробнее

Содержание Введение Часть 1.Компоненты Глава 1.Компьютерная морфология 1. Как найти слова 2. Каким может быть анализ слов 3.

Содержание Введение Часть 1.Компоненты Глава 1.Компьютерная морфология 1. Как найти слова 2. Каким может быть анализ слов 3. Содержание Введение Часть 1.Компоненты Глава 1.Компьютерная морфология 1. Как найти слова 2. Каким может быть анализ слов 3. Лексическая неоднозначность 4. Анализ морфологии на основе правил 4.1. Что хранить

Подробнее

ПРОГРАММА УЧЕБНОЙ ДИСЦИПЛИНЫ ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ В ФИЛОЛОГИИ Филология. Профиль подготовки: Русский язык. Количество зачетных единиц 4

ПРОГРАММА УЧЕБНОЙ ДИСЦИПЛИНЫ ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ В ФИЛОЛОГИИ Филология. Профиль подготовки: Русский язык. Количество зачетных единиц 4 ПРОГРАММА УЧЕБНОЙ ДИСЦИПЛИНЫ ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ В ФИЛОЛОГИИ для обучающихся по образовательной программе высшего профессионального образования подготовки магистров 45.04.01 Филология Профиль подготовки:

Подробнее

К СОЗДАНИЮ ПРЕДСТАВИТЕЛЬНОГО КОРПУСА СОВРЕМЕННОГО РУССКОГО ЯЗЫКА

К СОЗДАНИЮ ПРЕДСТАВИТЕЛЬНОГО КОРПУСА СОВРЕМЕННОГО РУССКОГО ЯЗЫКА К СОЗДАНИЮ ПРЕДСТАВИТЕЛЬНОГО КОРПУСА СОВРЕМЕННОГО РУССКОГО ЯЗЫКА С. А. Шаров, РосНИИ Искусственного Интеллекта, 125190, Москва, а/я 85, sharoff@aha.ru В статье вводятся основные понятия, необходимые для

Подробнее

аспирант каф. лексикологии английского языка ф-та ГПН МГЛУ;

аспирант каф. лексикологии английского языка ф-та ГПН МГЛУ; УДК 81 13 Т. Ю. Голечкова аспирант каф. лексикологии английского языка ф-та ГПН МГЛУ; e-mail: goletchkova@yadex.ru ИСПОЛЬЗОВАНИЕ КОРПУСНЫХ ДАННЫХ ПРИ ИССЛЕДОВАНИИ ДИСКУРСИВНЫХ ХАРАКТЕРИСТИК НАИМЕНОВАНИЯ

Подробнее

Обзор словарей для перевода. Немного о словарях и не только

Обзор словарей для перевода. Немного о словарях и не только Обзор словарей для перевода Немного о словарях и не только ВОПРОС Пользуетесь ли Вы при переводе «бумажными словарями»? Да (Почему?) Нет (Почему?) «Город переводчиков» Словарная статья Multilex Это электронный

Подробнее

International Scientific Journal

International Scientific Journal Филологические науки УДК 81:39 (035.3) Гуляева Татьяна Петровна кандидат культурологии, доцент, доцент кафедры иностранных языков Пензенский государственный университет архитектуры и строительства Gulyaeva

Подробнее

ИССЛЕДОВАНИЕ КОЛЛОКАЦИЙ С ПОМОЩЬЮ ЭКСПЕРИМЕНТОВ С ИНФОРМАНТАМИ

ИССЛЕДОВАНИЕ КОЛЛОКАЦИЙ С ПОМОЩЬЮ ЭКСПЕРИМЕНТОВ С ИНФОРМАНТАМИ А.Н.Савина, Е.В.Ягунова Исследование коллокаций с помощью экспериментов с информантами // Труды международной конференции «Корпусная лингвистика 2011». СПб.: С.- Петербургский гос. университет, Филологический

Подробнее

КОРПУС РУССКОГО ЯЗЫКА СЛОВАРНАЯ КАРТОТЕКА АКАДЕМИЧЕСКИЙ СЛОВАРЬ

КОРПУС РУССКОГО ЯЗЫКА СЛОВАРНАЯ КАРТОТЕКА АКАДЕМИЧЕСКИЙ СЛОВАРЬ А.С. Герд НАЦИОНАЛЬНЫЙ КОРПУС РУССКОГО ЯЗЫКА СЛОВАРНАЯ КАРТОТЕКА АКАДЕМИЧЕСКИЙ СЛОВАРЬ Разработчики корпусов, как правило, пишут о том, что может делать их корпус, исходя из своих внутренних авторских

Подробнее

УДК Баева Н.В., Большакова Е.И. ПРОБЛЕМЫ АВТОМАТИЗАЦИИ КОНТРОЛЯ УЧЕБНО-НАУЧНЫХ ТЕКСТОВ МГУ им. М.В.Ломоносова, факультет ВМК

УДК Баева Н.В., Большакова Е.И. ПРОБЛЕМЫ АВТОМАТИЗАЦИИ КОНТРОЛЯ УЧЕБНО-НАУЧНЫХ ТЕКСТОВ МГУ им. М.В.Ломоносова, факультет ВМК УДК 681.3 Баева Н.В., Большакова Е.И. ПРОБЛЕМЫ АВТОМАТИЗАЦИИ КОНТРОЛЯ УЧЕБНО-НАУЧНЫХ ТЕКСТОВ МГУ им. М.В.Ломоносова, факультет ВМК Приводится краткий обзор программных систем проверки учебно-научных текстов,

Подробнее

МЕТОДЫ АВТОМАТИЧЕСКОЙ РАЗМЕТКИ ТЕКСТОВ НАЦИОНАЛЬНОГО КОРПУСА ЯЗЫКА

МЕТОДЫ АВТОМАТИЧЕСКОЙ РАЗМЕТКИ ТЕКСТОВ НАЦИОНАЛЬНОГО КОРПУСА ЯЗЫКА О.М. ДЕМСКАЯ-КУЛЬЧИЦКАЯ, В.Р. СЕМЕРЕНКО, Р.А. ЮЩЕНКО МЕТОДЫ АВТОМАТИЧЕСКОЙ РАЗМЕТКИ ТЕКСТОВ НАЦИОНАЛЬНОГО КОРПУСА ЯЗЫКА Методы автоматической разметки рассмотрены в контексте исследования текстов естественного

Подробнее

УЧЕБНО-МЕТОДИЧЕСКИЙ КОМПЛЕКС. Основы лингвистических знаний. Этап 2. Основы прикладной лингвистики

УЧЕБНО-МЕТОДИЧЕСКИЙ КОМПЛЕКС. Основы лингвистических знаний. Этап 2. Основы прикладной лингвистики ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ Государственное образовательное учреждение высшего профессионального образования «Уральский государственный университет им. А.М. Горького» ИОНЦ «Русский язык» филологический

Подробнее

Параллельные корпусы в лингвистических исследованиях

Параллельные корпусы в лингвистических исследованиях Параллельные корпусы в лингвистических исследованиях Занятие 2: Автоматическое выравнивание параллельных корпусов Андрей Кутузов akutuzov@hse.ru Высшая школа экономики Фундаментальная и прикладная лингвистика

Подробнее

Компьютерный синтаксис - II. Антон Алексеев, Дмитрий Бобровников Computer Science Center Санкт-Петербург, 2017

Компьютерный синтаксис - II. Антон Алексеев, Дмитрий Бобровников Computer Science Center Санкт-Петербург, 2017 Компьютерный синтаксис - II Антон Алексеев, Дмитрий Бобровников Computer Science Center Санкт-Петербург, 2017 План занятия 1. 2. 3. Что такое парсинг и зачем он нужен Грамматика непосредственных составляющих

Подробнее

Понятие коллокации в лингвистике

Понятие коллокации в лингвистике Анализ эфффективности статистических методов выявления коллокаций в текстах на русском языке 1 Study of effectiveness of statistical measures for collocation extraction on Russian texts Захаров В. П. (vz1311@yandex.ru),

Подробнее

Национальный корпус калмыцкого языка: итоги работы и перспективы

Национальный корпус калмыцкого языка: итоги работы и перспективы Национальный корпус калмыцкого языка: итоги работы и перспективы В. В. Куканова Аннотация: В статье описаны итоги трехлетней работы по проекту «Национальный корпус калмыцкого языка: создание и разработка»,

Подробнее

DDC - ПРОГРАММА ПОИСКА ПО МОРФОЛОГИЧЕСКИ И CИНТАКСИЧЕСКИ РАЗМЕЧЕННОМУ МАССИВУ

DDC - ПРОГРАММА ПОИСКА ПО МОРФОЛОГИЧЕСКИ И CИНТАКСИЧЕСКИ РАЗМЕЧЕННОМУ МАССИВУ DDC - ПРОГРАММА ПОИСКА ПО МОРФОЛОГИЧЕСКИ И CИНТАКСИЧЕСКИ РАЗМЕЧЕННОМУ МАССИВУ А. В. Сокирко Берлинская и Бранденбургская Академия наук sokirko@yandex.ru Обоснование Главным предназначением системы DDC

Подробнее

«ЭЛЕКТРОННЫЕ ЛЕКСИКОГРАФИЧЕСКИЕ БАЗЫ ДАННЫХ» КАК УЧЕБНАЯ ДИСЦИПЛИНА ДЛЯ СТУДЕНТОВ ФИЛОЛОГИЧЕСКИХ СПЕЦИАЛЬНОСТЕЙ УНИВЕРСИТЕТОВ

«ЭЛЕКТРОННЫЕ ЛЕКСИКОГРАФИЧЕСКИЕ БАЗЫ ДАННЫХ» КАК УЧЕБНАЯ ДИСЦИПЛИНА ДЛЯ СТУДЕНТОВ ФИЛОЛОГИЧЕСКИХ СПЕЦИАЛЬНОСТЕЙ УНИВЕРСИТЕТОВ «ЭЛЕКТРОННЫЕ ЛЕКСИКОГРАФИЧЕСКИЕ БАЗЫ ДАННЫХ» КАК УЧЕБНАЯ ДИСЦИПЛИНА ДЛЯ СТУДЕНТОВ ФИЛОЛОГИЧЕСКИХ СПЕЦИАЛЬНОСТЕЙ УНИВЕРСИТЕТОВ Е. Е. ИВАНОВ МГУ им. А. А. Кулешова, Могилёв Подготовка филологов, преподавателей

Подробнее

К ВОПРОСУ РАЗРАБОТКИ СЛОВАРЕЙ ИНФОРМАЦИОННОЙ СИСТЕМЫ «МАШИННЫЙ ФОНД БЕЛОРУССКОГО ЯЗЫКА»

К ВОПРОСУ РАЗРАБОТКИ СЛОВАРЕЙ ИНФОРМАЦИОННОЙ СИСТЕМЫ «МАШИННЫЙ ФОНД БЕЛОРУССКОГО ЯЗЫКА» Н.К. Рубашко, Г.П. Невмержицкая (Минск, БГУ) К ВОПРОСУ РАЗРАБОТКИ СЛОВАРЕЙ ИНФОРМАЦИОННОЙ СИСТЕМЫ «МАШИННЫЙ ФОНД БЕЛОРУССКОГО ЯЗЫКА» В научно-исследовательской лаборатории интеллектуальных информационных

Подробнее

Правительство Российской Федерации. Факультет гуманитарных наук. Школа лингвистики. Программа дисциплины

Правительство Российской Федерации. Факультет гуманитарных наук. Школа лингвистики. Программа дисциплины Правительство Российской Федерации Федеральное государственное автономное образовательное учреждение высшего образования "Национальный исследовательский университет "Высшая школа экономики" Факультет гуманитарных

Подробнее

Рабочая программа дисциплины «Автоматическая обработка текстов»

Рабочая программа дисциплины «Автоматическая обработка текстов» Федеральное государственное автономное образовательное учреждение высшего образования "Национальный исследовательский университет "Высшая школа экономики" Факультет компьютерных наук Департамент анализа

Подробнее

РАЗРАБОТКА ЛИНГВИСТИЧЕСКОГО ОБЕСПЕЧЕНИЯ ИНФОРМАЦИОННЫХ СИСТЕМ НА ОСНОВЕ ОНТОЛОГИЧЕСКИХ МОДЕЛЕЙ ЗНАНИЙ

РАЗРАБОТКА ЛИНГВИСТИЧЕСКОГО ОБЕСПЕЧЕНИЯ ИНФОРМАЦИОННЫХ СИСТЕМ НА ОСНОВЕ ОНТОЛОГИЧЕСКИХ МОДЕЛЕЙ ЗНАНИЙ УДК 004.912 519.689.3 РАЗРАБОТКА ЛИНГВИСТИЧЕСКОГО ОБЕСПЕЧЕНИЯ ИНФОРМАЦИОННЫХ СИСТЕМ НА ОСНОВЕ ОНТОЛОГИЧЕСКИХ МОДЕЛЕЙ ЗНАНИЙ Е.А. Сидорова Институт систем информатики им. А.П. Ершова СО РАН, г. Новосибирск

Подробнее

Титульный лист отчета о работе в 2012 г. по Программе фундаментальных исследований Президиума РАН «Корпусная лингвистика»

Титульный лист отчета о работе в 2012 г. по Программе фундаментальных исследований Президиума РАН «Корпусная лингвистика» Титульный лист отчета о работе в 2012 г. по Программе фундаментальных исследований Президиума РАН «Корпусная лингвистика» Номер и название направления Программы Направление 3. Создание и развитие корпусных

Подробнее

Корпусный анализ текстов студентов РКИ (демонстрация корпуса RLC)

Корпусный анализ текстов студентов РКИ (демонстрация корпуса RLC) Корпусный анализ текстов студентов РКИ (демонстрация корпуса RLC) Алина Ладыгина, Александра Дегтярь Университет Эберхарда и Карла, Тюбинген / НИУ ВШЭ aladygina@yahoo.com, agdegtyar@gmail.com План Что

Подробнее

>>> New headway elementary fourth edition скачать бесплатно

>>> New headway elementary fourth edition скачать бесплатно New headway elementary fourth edition скачать бесплатно >>> New headway elementary fourth edition скачать бесплатно New headway elementary fourth edition скачать бесплатно It moves away from examining

Подробнее

Правительство Российской Федерации

Правительство Российской Федерации Правительство Российской Федерации Федеральное государственное автономное образовательное учреждение высшего образования "Национальный исследовательский университет "Высшая школа экономики" Факультет гуманитарных

Подробнее

УДК Желтов Павел Валерианович,

УДК Желтов Павел Валерианович, УДК 004.912 Желтов Павел Валерианович, к.т.н., доцент, ФГБОУ ВО «Чувашский государственный университет им. И.Н. Ульянова, г. Чебоксары, Чувашская Республика; Ятманов Владимир Анатольевич, к.пед.н., ФГБОУ

Подробнее

ВОЗМОЖНОСТИ ИСПОЛЬЗОВАНИЯ МЕТОДОВ КОРПУСНОЙ ЛИНГВИСТИКИ ПРИ ПЕРЕВОДЕ CORPUS LINGUISTICS AND CORPUS-BASED APPROACHES IN TRANSLATION

ВОЗМОЖНОСТИ ИСПОЛЬЗОВАНИЯ МЕТОДОВ КОРПУСНОЙ ЛИНГВИСТИКИ ПРИ ПЕРЕВОДЕ CORPUS LINGUISTICS AND CORPUS-BASED APPROACHES IN TRANSLATION УДК 81'33 Сырчина А.С., ассистент кафедры иностранных языков и межкультурной профессиональной коммуникации естественнонаучных направлений Тюменский государственный университет Россия, г. Тюмень ВОЗМОЖНОСТИ

Подробнее

ПРИКЛАДНЫЕ ПРОГРАММНЫЕ СРЕДСТВА ПРИ ПОДГОТОВКЕ ПЕРЕВОДЧИКА НАУЧНО-ТЕХНИЧЕСКИХ ТЕКСТОВ

ПРИКЛАДНЫЕ ПРОГРАММНЫЕ СРЕДСТВА ПРИ ПОДГОТОВКЕ ПЕРЕВОДЧИКА НАУЧНО-ТЕХНИЧЕСКИХ ТЕКСТОВ ПРИКЛАДНЫЕ ПРОГРАММНЫЕ СРЕДСТВА ПРИ ПОДГОТОВКЕ ПЕРЕВОДЧИКА НАУЧНО-ТЕХНИЧЕСКИХ ТЕКСТОВ Д.А. Алферова Кафедра иностранных языков 4 Институт иностранных языков Российский университет дружбы народов ул. Миклухо-Маклая,

Подробнее

linguistic corpus text corpus linguistic corpora).

linguistic corpus text corpus linguistic corpora). Сырчина Анна Сергеевна Тюменский государственный университет Институт математики и компьютерных наук Кафедра иностранных языков и межкультурной профессиональной коммуникации естественнонаучных направлений

Подробнее

СИСТЕМА АВТОМАТИЧЕСКОГО ПОРОЖДЕНИЯ АНГЛОЯЗЫЧНЫХ ДЕЛОВЫХ ЭЛЕКТРОННЫХ ПИСЕМ. Введение

СИСТЕМА АВТОМАТИЧЕСКОГО ПОРОЖДЕНИЯ АНГЛОЯЗЫЧНЫХ ДЕЛОВЫХ ЭЛЕКТРОННЫХ ПИСЕМ. Введение УДК 004.822:514 СИСТЕМА АВТОМАТИЧЕСКОГО ПОРОЖДЕНИЯ АНГЛОЯЗЫЧНЫХ ДЕЛОВЫХ ЭЛЕКТРОННЫХ ПИСЕМ Т.В. Бусел (tatsiana-busel@yandex.ru) Белорусский государственный лингвистический университет, г. Минск, Республика

Подробнее

ПОДХОД К АВТОМАТИЗАЦИИ СБОРА ОНТОЛОГИЧЕСКОЙ ИНФОРМАЦИИ ДЛЯ ИНТЕРНЕТ-ПОРТАЛА ЗНАНИЙ 1

ПОДХОД К АВТОМАТИЗАЦИИ СБОРА ОНТОЛОГИЧЕСКОЙ ИНФОРМАЦИИ ДЛЯ ИНТЕРНЕТ-ПОРТАЛА ЗНАНИЙ 1 ПОДХОД К АВТОМАТИЗАЦИИ СБОРА ОНТОЛОГИЧЕСКОЙ ИНФОРМАЦИИ ДЛЯ ИНТЕРНЕТ-ПОРТАЛА ЗНАНИЙ 1 О.И. Боровикова olesya@iis.nsk.su Ю.А. Загорулько zagor@iis.nsk.su Е.А. Сидорова lena@iis.nsk.su Институт систем информатики

Подробнее

Информационные технологии в лингвистике реферат

Информационные технологии в лингвистике реферат Информационные технологии в лингвистике реферат >>> Информационные технологии в лингвистике реферат Информационные технологии в лингвистике реферат Да, в любом случае. Примеры моделирования различных процессов.

Подробнее

Введение в обработку текстов. лекция 1

Введение в обработку текстов. лекция 1 Введение в обработку текстов лекция 1 О курсе Лектор: Турдаков Денис Юрьевич Лекции каждую пятницу в 18.00 ауд. П-6 Математический спецкурс для 3-5 курсов. предполагаются минимальные знания линейной алгебры,

Подробнее

Словарь и корпус текстов вепсского языка в виде компьютерной онлайн-системы (технический отчёт)

Словарь и корпус текстов вепсского языка в виде компьютерной онлайн-системы (технический отчёт) Словарь и корпус текстов вепсского языка в виде компьютерной онлайн-системы (технический отчёт) Veps dictionary and text corpus as an online computer system (technical report) А. А. Крижановский Andrew.Krizhanovsky

Подробнее

К.К. Боярский, В.П. Захаров, Е.А. Каневский

К.К. Боярский, В.П. Захаров, Е.А. Каневский К.К. Боярский, В.П. Захаров, Е.А. Каневский СНЯТИЕ НЕОДНОЗНАЧНОСТИ МОРФОЛОГИЧЕСКОЙ РАЗМЕТКИ КОРПУСОВ РУССКИХ ТЕКСТОВ 1 1. Характеристика положения в данной области Сравнительно недавно, во второй половине

Подробнее

Корпусная лингвистка. проект Открытый Корпус и место компьютерной лингвистики в народном хозяйстве. Докладчик: Бочаров Виктор

Корпусная лингвистка. проект Открытый Корпус и место компьютерной лингвистики в народном хозяйстве. Докладчик: Бочаров Виктор Корпусная лингвистка проект Открытый Корпус и место компьютерной лингвистики в народном хозяйстве Докладчик: Бочаров Виктор июль 2011 О докладчике Виктор Бочаров: аспирант кафедры математической лингвистики

Подробнее

ОТВЕТСТВЕННЫЙ РЕДАКТОР: заведующий кафедрой английской филологии Дрожащих Н.В., д.ф.н., доцент

ОТВЕТСТВЕННЫЙ РЕДАКТОР: заведующий кафедрой английской филологии Дрожащих Н.В., д.ф.н., доцент Дрожащих Н.В. Квантитативная лингвистика. Учебно-методический комплекс. Рабочая программа для аспирантов направления 45.06.01 Языкознание и литературоведение (Теория языка) очной и заочной форм обучения.

Подробнее

ИЗВЛЕЧЕНИЕ И КЛАССИФИКАЦИЯ ТЕРМИНОЛОГИЧЕСКИХ КОЛЛОКАЦИЙ НА МАТЕРИАЛЕ ЛИНГВИСТИЧЕСКИХ НАУЧНЫХ ТЕКСТОВ (ПРЕДВАРИТЕЛЬНЫЕ НАБЛЮДЕНИЯ)

ИЗВЛЕЧЕНИЕ И КЛАССИФИКАЦИЯ ТЕРМИНОЛОГИЧЕСКИХ КОЛЛОКАЦИЙ НА МАТЕРИАЛЕ ЛИНГВИСТИЧЕСКИХ НАУЧНЫХ ТЕКСТОВ (ПРЕДВАРИТЕЛЬНЫЕ НАБЛЮДЕНИЯ) Пивоварова Л.М., Ягунова Е.В. Извлечение и классификация терминологических коллокаций на материале лингвистических научных текстов (предварительные наблюдения) // Материалы Симпозиума "Терминология и знание"

Подробнее

Введение в обработку текстов

Введение в обработку текстов Введение в обработку текстов лекция 1 О курсе Лектор: Турдаков Денис Юрьевич Лекции каждую пятницу в 18.00 ауд. 707 Математический спецкурс для 3-5 курсов. предполагаются минимальные занания линейной алгебры,

Подробнее

À»Õ Œƒ»ƒ»» œœ Õ» À Œ œ Œ»ÕŒfl«Õ Œ. УДК 81:811.1/.2 Н. В. Козлова ЛИНГВИСТИЧЕСКИЕ КОРПУСА: ОПРЕДЕЛЕНИЕ ОСНОВНЫХ ПОНЯТИЙ И ТИПОЛОГИЯ

À»Õ Œƒ»ƒ»» œœ Õ» À Œ œ Œ»ÕŒfl«Õ Œ. УДК 81:811.1/.2 Н. В. Козлова ЛИНГВИСТИЧЕСКИЕ КОРПУСА: ОПРЕДЕЛЕНИЕ ОСНОВНЫХ ПОНЯТИЙ И ТИПОЛОГИЯ À»Õ Œƒ»ƒ»» œœ Õ» À Œ œ Œ»ÕŒfl«Õ Œ УДК 81:811.1/.2 Н. В. Козлова ÕÓ ÓÒË ËрÒÍËÈ ÓÒÛ рòú ÂÌÌ È ÛÌË ÂрÒËÚÂÚ ÛÎ. œëрó Ó, 2, ÕÓ ÓÒË ËрÒÍ, 630090, ÓÒÒˡ E-mail: talja@ngs.ru ЛИНГВИСТИЧЕСКИЕ КОРПУСА: ОПРЕДЕЛЕНИЕ

Подробнее

>>> Решебник professional english in use

>>> Решебник professional english in use Решебник professional english in use >>> Решебник professional english in use Решебник professional english in use Find Me in Social Networks: Вы можете оставить свой отзыв, сообщить о нерабочей ссылке,

Подробнее

ТЕМА: «Пользователь офисных программ персонального компьютера. Курс для начинающих» Цель обучения: Контингент слушателей: Срок обучения:

ТЕМА: «Пользователь офисных программ персонального компьютера. Курс для начинающих» Цель обучения: Контингент слушателей: Срок обучения: ТЕМА: «Пользователь офисных программ персонального компьютера. Курс для начинающих» работы на современном ПК. Изучение принципов ведения рабочей документации и организация документооборота предприятия

Подробнее

База средневекового французского языка BFM: открытый ресурс для научных исследований и популяризаторской деятельности

База средневекового французского языка BFM: открытый ресурс для научных исследований и популяризаторской деятельности База средневекового французского языка BFM: открытый ресурс для научных исследований и популяризаторской деятельности А.М. Лаврентьев Лаборатория ICAR Национальный центр научных исследований Франции и

Подробнее

Частеречная разметка слов с использованием гетерогенной нейронной сети и априорной информации

Частеречная разметка слов с использованием гетерогенной нейронной сети и априорной информации УДК 004.934.1 Частеречная разметка слов с использованием гетерогенной нейронной сети и априорной информации Введение Маланин Г.П., студент кафедра «Программное обеспечение ЭВМ и информационные технологии»,

Подробнее

Рабочая программа дисциплины «Компьютерная лингвистика и анализ текста»

Рабочая программа дисциплины «Компьютерная лингвистика и анализ текста» Федеральное государственное автономное образовательное учреждение высшего образования "Национальный исследовательский университет "Высшая школа экономики" Факультет Компьютерных наук Департамент анализа

Подробнее

1. Информация. 2. Устройство ПК

1. Информация. 2. Устройство ПК 1. Информация Кодирование информации, двоичное кодирование. Количество информации и единицы измерения. Бит, байт, слово. Килобайт, мегабайт. Шестнадцатеричная система счисления. 2. Устройство ПК Назначение

Подробнее

Как и зачем мы делаем Открытый корпус

Как и зачем мы делаем Открытый корпус Как и зачем мы делаем Открытый корпус В. В. Бочаров Д. В. Грановский Mathlingvo 14 мая 2011 г. Жизненный цикл текста 1 Исходный текст под лицензией, совместимой с CC-BY-SA проходит вычитку делится на абзацы,

Подробнее

М.-А.Н. Поландова Квантитативные и квалитативные методы исследования метафоры в компьютерном дискурсе

М.-А.Н. Поландова Квантитативные и квалитативные методы исследования метафоры в компьютерном дискурсе М.-А.Н. Поландова Квантитативные и квалитативные методы исследования метафоры в компьютерном дискурсе Исследование метафоры как лингвистического явления имеет богатую историю. Традиционно художественный

Подробнее

Создание и лингвистическая разметка звуковой словарно-грамматической базы. данных по ительменскому языку

Создание и лингвистическая разметка звуковой словарно-грамматической базы. данных по ительменскому языку Создание и лингвистическая разметка звуковой словарно-грамматической базы данных по ительменскому языку A sound lexico-grammatical database of the Itelmen language: creation and linguistic annotation Долозова

Подробнее

Правительство Российской Федерации. Факультет гуманитарных наук Школа лингвистики. Рабочая программа дисциплины «Научно-исследовательский семинар»

Правительство Российской Федерации. Факультет гуманитарных наук Школа лингвистики. Рабочая программа дисциплины «Научно-исследовательский семинар» Правительство Российской Федерации Федеральное государственное автономное образовательное учреждение высшего профессионального образования "Национальный исследовательский университет "Высшая школа экономики"

Подробнее

Программа вступительного испытания на программы магистратуры по направлению «Лингвистика»

Программа вступительного испытания на программы магистратуры по направлению «Лингвистика» Программа вступительного испытания на программы магистратуры по направлению 45.04.02 «Лингвистика» Настоящая программа предназначена для проведения вступительных испытаний для поступающих на основную образовательную

Подробнее

АНАЛИЗ И ВЫБОР СИСТЕМ АВТОМАТИЗИРОВАННОГО ПЕРЕВОДА

АНАЛИЗ И ВЫБОР СИСТЕМ АВТОМАТИЗИРОВАННОГО ПЕРЕВОДА УДК 004.4 Егоров В. А. студент 4 курс, факультет «Информационных систем и технологий» Поволжский Государственный Университет Телекоммуникаций и Информатики Россия, г.самара АНАЛИЗ И ВЫБОР СИСТЕМ АВТОМАТИЗИРОВАННОГО

Подробнее

Словарь и корпус текстов вепсского языка в виде компьютерной онлайн-системы (технический отчёт за 2013 г.)

Словарь и корпус текстов вепсского языка в виде компьютерной онлайн-системы (технический отчёт за 2013 г.) Словарь и корпус текстов вепсского языка в виде компьютерной онлайн-системы (технический отчёт за 2013 г.) Veps dictionary and text corpus as an online computer system (technical report 2013) А. А. Крижановский

Подробнее

Митрофанова О. А. Санкт-Петербургский государственный университет (СПбГУ)

Митрофанова О. А. Санкт-Петербургский государственный университет (СПбГУ) Автоматизированный анализ терминологии в русскоязычном корпусе текстов по корпусной лингвистике 1 Automatic analysis of terminology in the Russian text corpus on corpus linguistics Митрофанова О. А. (alkonost-om@yandex.ru)

Подробнее

Школа лингвистики Гуманитарного факультета

Школа лингвистики Гуманитарного факультета Правительство Российской Федерации Федеральное государственное автономное образовательное учреждение высшего профессионального образования «Национальный исследовательский университет Высшая школа экономики»

Подробнее