НАУЧНЫЙ СЕМИНАР «КОМПЬЮТЕРНАЯ ЛИНГВИСТИКА и TEXT MINING» Департамент анализа данных и искусственного интеллекта ФКН НИУ ВШЭ

Save this PDF as:
 WORD  PNG  TXT  JPG

Размер: px
Начинать показ со страницы:

Download "НАУЧНЫЙ СЕМИНАР «КОМПЬЮТЕРНАЯ ЛИНГВИСТИКА и TEXT MINING» Департамент анализа данных и искусственного интеллекта ФКН НИУ ВШЭ"

Транскрипт

1 НАУЧНЫЙ СЕМИНАР «КОМПЬЮТЕРНАЯ ЛИНГВИСТИКА и TEXT MINING» Департамент анализа данных и искусственного интеллекта ФКН НИУ ВШЭ

2 НИС КЛиМТ : ПРЕПОДАВАТЕЛИ Большакова Елена Игоревна, к.ф-м.н, доцент Ефремова Наталья Эрнестовна, к.ф-м.н, доцент Черняк Екатерина Леонидовна, м.н.с, преподаватель Ильвовский Дмитрий Алексеевич, м.н.с, преподаватель Департамент Анализа данных и Искусственного интеллекта 2

3 КОМПЬЮТЕРНАЯ ЛИНГВИСТИКА: ОСНОВНАЯ ЗАДАЧА Начало работ 50-е годы 20-го века: машинный перевод Междисциплинарное научное направление: Математика Информатика (Computer Science) Искусственный интеллект (Artificial Intelligence) Лингвистика Основная цель разработка компьютерных программ для автоматической обработки неструктурированных текстов на ЕЯ лингвистических процессоров используют формальные модели языка зависят от конкретного естественного языка например, редактор Word, но не NotePad 3

4 СЛОЖНОСТЬ ЕЯ и ЗАДАЧ КЛ Сложность создания лингвистических процессоров: Многоуровневость любого ЕЯ и текста Неоднозначность единиц ЕЯ Уровни языковой системы: морфологический: слова (словоформы); подуровень морфем (корень, суффикс ) лексический: множество лексем (лексикон) синтаксический: предложения (фразы) семантический (смысловой) и дискурсивный (схематические структуры текста) Каждый уровень правила сочетания единиц Уровни ЕЯ взаимосвязаны 4

5 НЕОДНОЗНАЧНОСТЬ ЕЯ Часто нет однозначной связи единицы языка и ее смысла Полисемия многозначность языковой единицы земля: земля, суша, почва, страна, территория Синонимия совпадение единиц по основному смыслу: о поездке про поездку, горячий жаркий Омонимия звуковое совпадение или совпадение на письме (по форме) двух или более языковых единиц лук оружие/овощ, стих существительное/глагол Еще одна сложность ЕЯ нестандартная сочетаемость единиц на всех уровнях: крепкий чай, но не тяжелый чай (heavy tea) 5

6 МОДЕЛИ ЯЗЫКА Структурные модели учитывают лингвистические особенности одного или несколько уровней ЕЯ Модели морфологии Модели синтаксиса (синтаксические деревья: деревья составляющих, деревья зависимостей) Модели семантики и дискурса Статистические модели опираются на статистику символов /букв и их последовательностей N-грамм слов и их последовательностей: статистическая языковая модель (Language Model) При создании модели вычисляют частоты и вероятности по корпусу/коллекции текстов Комбинированные (гибридные) модели 6

7 ЭТАПЫ ОБРАБОТКИ ТЕКСТА В СТРУКТУРНОЙ МОДЕЛИ ЕЯ Уровни (этапы) анализа текста уровни языковой системы Текст This is a text that represents the meaning shown in the right part of the picture. This is a text that represents the meaning shown in the right part of the picture. This is a text that represents the meaning shown in the right part of the picture. This is a text that represents the meaning shown in the right part of the picture. This is a text that represents the meaning shown in the right part of the picture. This is a text that represents the meaning shown in the right part of the picture. This is a text that represents the meaning shown in the right part of the picture. This is a text that represents the meaning shown in the right part of the picture. This is a text that represents the meaning shown in the right part of the picture. This is a text that represents the Морфологический модуль Язык Синтаксический модуль Семантический модуль Смысл Поверхностное представление Внутреннее представление Морфологическое представление Синтасическое представление 7

8 ЛИНГВИСТИЧЕСКИЕ РЕСУРСЫ Лингвистические процессоры используют: Компьютерные словари: морфологические и др. Грамматики ЕЯ : для синтаксических процессоров Тезаурусы (семантические словари) и онтологии: WordNet Коллекции и корпуса текстов Коллекция набор текстов, собранных по некоторому признаку (нормативно-правовые документы) Лингвистический корпус текстов предназначен для решения лингвистических задач размечен по определенным правилам (морфологическая разметка и др.) примеры корпусов: BrownCorpus, BNC, Национальный корпус РЯ, OpenCorpora 8

9 ПРИКЛАДНЫЕ ЗАДАЧИ КЛ Традиционные направления: Машинный перевод Информационный поиск Реферирование и аннотирование текстов Автоматизация подготовки и редактирования текстов Генерация текстов на ЕЯ Формирование ответов на вопросы Организация диалога с пользователем на ЕЯ Text mining: Извлечение информации из текстов Классификация и кластеризация текстов Извлечение терминов и ключевых слов Извлечение мнений и анализ тональности текстов 9

10 ПОДХОДЫ К РЕШЕНИЮ Инженерный подход: применение структурных моделей, лингвистических правил и шаблонов правила и шаблоны пишут эксперты используются лингвистические ресурсы для записи правил нужны специальные языки и поддерживающие их программные средства: GATE, Томита-парсер, LSPL и др. Машинное обучение: опора на статистические (вероятностные) модели и методы необходима размеченная вручную обучающая текстовая выборка Современная тенденция: комбинирование машинного обучения и инженерного подхода 10

11 МАШИННЫЙ ПЕРЕВОД Джорджтаунский эксперимент, 1954 г.: автоматический перевод с русского на английский Периодизация методов/систем: гг. двуязычные системы, пословный и пословно-пооборотный перевод гг. пофразный перевод гг. многоязычные системы гг. многоязычные системы, использование крупных лексических и терминологических ресурсов 2000 гг. использование статистики, корпусов текстов, статистический машинный перевод Но: проблема полностью автоматического перевода текстов по открытой тематике неразрешима. 11

12 ИНФОРМАЦИОННЫЙ ПОИСК Центральная задача: индексирование документа на ЕЯ, т.е. выделение в нем значимых слов и словосочетаний Смежные задачи информационного поиска: Реферирование текста построение краткого реферата для одного или нескольких тематически связанных текстов Аннотирование текста построение аннотации документа а также задачи: Классификация текстов отнесение к классам с заданными свойствами/параметрами Рубрицирование текстов классификация, соотнесение с иерархической системой классов Кластеризация текстов создание подмножеств близких (например, тематически) документов 12

13 ПРИМЕНЕНИЕ КЛАССИФИКАЦИИ и КЛАСТЕРИЗАЦИИ Упорядочивание и навигация по набору документов составление интернет-каталогов Информационный поиск: ограничение области поиска «интеллектуальная» группировка результатов Фильтрация потока документов: фильтрация спама выявление «искусственных» текстов (боты) определение дубликатов документов Персонализированный/тематический подбор информации: контекстная реклама новости об определенном событии и т.п. 13

14 ИЗВЛЕЧЕНИЕ ИНФОРМАЦИИ ИЗ ТЕКСТОВ Information Extraction (IE): Особенности задачи: Обрабатывается текст, чаще коллекция текстов Извлекаются данные, релевантные определенной проблеме, вопросу, теме Значимые объекты (персоналии, фирмы и т.п.) Атрибуты и отношения объектов, факты и события: прошла встреча, выдан кредит Термины и их связи, ключевые слова: электрический слой Извлеченные данные структурируются визуализируются Приложения: мониторинг новостных лент (сколько кораблей затонуло в текущем году? ) аналитика экономической и производств. деятельности 14

15 OPINION MINING, SENTIMENT ANALYSIS Извлечение мнений и анализ их тональности Мнение общая эмоция, суждение или оценка автора текста по поводу некоторой сущности Тональность эмоциональная оценка, выраженная в тексте по отношению к некоторой сущности в целом или ее частям/свойствам/характеристикам Виды оценок тональности: двоичная (+/ ), троичная (+/ /0), по некоторой шкале Применяется для анализа отзывов/мнений о персонах, политических партиях, товарах, компаниях и др. Последняя тенденция выделение аспектов оцениваемой сущности, например: сущность ресторан, ее аспекты кухня, сервис, интерьер, цена и др. 15

16 АСПЕКТНЫЙ АНАЛИЗ МНЕНИЙ: ВИЗУАЛИЗАЦИЯ 16

17 СЕМИНАР, КУРСОВЫЕ и ВКР Что на самом научном семинаре? лекции (немного) + доклады студентов + обсуждения Итоговая оценка по НИС по сделанным докладам и участию в обсуждениях Возможные темы курсовых и ВКР: извлечение информации о событиях/фактах: (спортивные события: участники соревнования, итог) выявление и визуализация мнений с tripadvisor.ru извлечение терминов для языковых ресурсов построение аннотаций и рефератов документов Есть темы, где требуется не только и не столько программирование и математика 17

18 СПАСИБО ЗА ВНИМАНИЕ! Вопросы? 18

Содержание Введение Часть 1.Компоненты Глава 1.Компьютерная морфология 1. Как найти слова 2. Каким может быть анализ слов 3.

Содержание Введение Часть 1.Компоненты Глава 1.Компьютерная морфология 1. Как найти слова 2. Каким может быть анализ слов 3. Содержание Введение Часть 1.Компоненты Глава 1.Компьютерная морфология 1. Как найти слова 2. Каким может быть анализ слов 3. Лексическая неоднозначность 4. Анализ морфологии на основе правил 4.1. Что хранить

Подробнее

АВТОМАТИЧЕСКАЯ ОБРАБОТКА ТЕКСТОВ: ЗАДАЧИ, ПОДХОДЫ, РЕСУРСЫ

АВТОМАТИЧЕСКАЯ ОБРАБОТКА ТЕКСТОВ: ЗАДАЧИ, ПОДХОДЫ, РЕСУРСЫ АВТОМАТИЧЕСКАЯ ОБРАБОТКА ТЕКСТОВ: ЗАДАЧИ, ПОДХОДЫ, РЕСУРСЫ Большакова Елена Игоревна МГУ имени М.В.Ломоносова, ф-т ВМК СОДЕРЖАНИЕ 1. Компьютерная лингвистика (КЛ) и автоматическая обработка текстов (АОТ):

Подробнее

Рабочая программа дисциплины «Автоматическая обработка текстов»

Рабочая программа дисциплины «Автоматическая обработка текстов» Федеральное государственное автономное образовательное учреждение высшего образования "Национальный исследовательский университет "Высшая школа экономики" Факультет компьютерных наук Департамент анализа

Подробнее

Магистрант: Бименова Жанат Батырбековна Научный руководитель: к.ф.-м.н. Сидорова Елена Анатольевна

Магистрант: Бименова Жанат Батырбековна Научный руководитель: к.ф.-м.н. Сидорова Елена Анатольевна Магистрант: Бименова Жанат Батырбековна Научный руководитель: к.ф.-м.н. Сидорова Елена Анатольевна Разработка методов и средств автоматизации построения тезаурусов предметных областей 1 Цели работы Разработка

Подробнее

Научный семинар. Часть 2. Text mining. Екатерина Черняк (дадии, Тьюторский центр) Дмитрий Ильвовский (дадии, НУЛ ИССА)

Научный семинар. Часть 2. Text mining. Екатерина Черняк (дадии, Тьюторский центр) Дмитрий Ильвовский (дадии, НУЛ ИССА) Научный семинар. Часть 2. Text mining Екатерина Черняк (дадии, Тьюторский центр) Дмитрий Ильвовский (дадии, НУЛ ИССА) Основные темы Стратегии сбора веб-корпусов Разрешение морфологической неоднозначности

Подробнее

ПОДХОД К АВТОМАТИЗАЦИИ СБОРА ОНТОЛОГИЧЕСКОЙ ИНФОРМАЦИИ ДЛЯ ИНТЕРНЕТ-ПОРТАЛА ЗНАНИЙ 1

ПОДХОД К АВТОМАТИЗАЦИИ СБОРА ОНТОЛОГИЧЕСКОЙ ИНФОРМАЦИИ ДЛЯ ИНТЕРНЕТ-ПОРТАЛА ЗНАНИЙ 1 ПОДХОД К АВТОМАТИЗАЦИИ СБОРА ОНТОЛОГИЧЕСКОЙ ИНФОРМАЦИИ ДЛЯ ИНТЕРНЕТ-ПОРТАЛА ЗНАНИЙ 1 О.И. Боровикова olesya@iis.nsk.su Ю.А. Загорулько zagor@iis.nsk.su Е.А. Сидорова lena@iis.nsk.su Институт систем информатики

Подробнее

Выводы Науч. рук. к.т.н., доц. Звенигородский А.С. Определение биграмм на материале научных текстов по извлечению данных из текстов

Выводы Науч. рук. к.т.н., доц. Звенигородский А.С. Определение биграмм на материале научных текстов по извлечению данных из текстов Рис. 3. Пример сдвига на две позиции Выводы Рассмотренные методы позволяют совершенствовать технологию формирования растровых стереоизображений, а разработанный плагин дает возможность ускорения этого

Подробнее

ориентированных на создание операциональных моделей и ресурсов (корпусов, тезаурусов, онтологий).

ориентированных на создание операциональных моделей и ресурсов (корпусов, тезаурусов, онтологий). ориентированных на создание операциональных моделей и ресурсов (корпусов, тезаурусов, онтологий). Дисциплина (модуль) направлена на формирование компетенций выпускника: способностью к абстрактному мышлению,

Подробнее

Искусственный интеллект как научная область.

Искусственный интеллект как научная область. Искусственный интеллект как научная область. Лекция 1. Специальность : 230105 Предмет изучения. Под Искусственным Интеллектом (ИИ) понимается область исследований, в которой ставится задача изучения и

Подробнее

Ю.А. Загорулько. Институт систем информатики имени А.П. Ершова СО РАН Новосибирск, Россия

Ю.А. Загорулько. Институт систем информатики имени А.П. Ершова СО РАН Новосибирск, Россия Технология обеспечения содержательного доступа к систематизированным знаниям и информационным ресурсам заданной области знаний и средствам их интеллектуальной обработки Ю.А. Загорулько Институт систем

Подробнее

Характеристика профессиональной деятельности выпускников

Характеристика профессиональной деятельности выпускников х> \ университет /s^ // ' ^Ч ft// УТВЕРЖДАЮ по учебной работе А.Б. Безбородов «Ж> OG 2016 г. Аннотация основной образовательной программу высшего профессионального образования по напрэдшжшо подготовки

Подробнее

ОТВЕТСТВЕННЫЙ РЕДАКТОР: заведующий кафедрой английской филологии Дрожащих Н.В., д.ф.н., доцент

ОТВЕТСТВЕННЫЙ РЕДАКТОР: заведующий кафедрой английской филологии Дрожащих Н.В., д.ф.н., доцент Дрожащих Н.В. Квантитативная лингвистика. Учебно-методический комплекс. Рабочая программа для аспирантов направления 45.06.01 Языкознание и литературоведение (Теория языка) очной и заочной форм обучения.

Подробнее

РАЗРАБОТКА ЛИНГВИСТИЧЕСКОГО ОБЕСПЕЧЕНИЯ ИНФОРМАЦИОННЫХ СИСТЕМ НА ОСНОВЕ ОНТОЛОГИЧЕСКИХ МОДЕЛЕЙ ЗНАНИЙ

РАЗРАБОТКА ЛИНГВИСТИЧЕСКОГО ОБЕСПЕЧЕНИЯ ИНФОРМАЦИОННЫХ СИСТЕМ НА ОСНОВЕ ОНТОЛОГИЧЕСКИХ МОДЕЛЕЙ ЗНАНИЙ УДК 004.912 519.689.3 РАЗРАБОТКА ЛИНГВИСТИЧЕСКОГО ОБЕСПЕЧЕНИЯ ИНФОРМАЦИОННЫХ СИСТЕМ НА ОСНОВЕ ОНТОЛОГИЧЕСКИХ МОДЕЛЕЙ ЗНАНИЙ Е.А. Сидорова Институт систем информатики им. А.П. Ершова СО РАН, г. Новосибирск

Подробнее

Искусственный интеллект. Компьютерный перевод как один из первых шагов к коммерциализации искусственного интеллекта Юлия Епифанцева PROMT

Искусственный интеллект. Компьютерный перевод как один из первых шагов к коммерциализации искусственного интеллекта Юлия Епифанцева PROMT Искусственный интеллект Компьютерный перевод как один из первых шагов к коммерциализации искусственного интеллекта Юлия Епифанцева PROMT Что такое искусственный интеллект? Искусственный Интеллект (Artificial

Подробнее

УЧЕБНО-МЕТОДИЧЕСКИЙ КОМПЛЕКС. Основы лингвистических знаний. Этап 2. Основы прикладной лингвистики

УЧЕБНО-МЕТОДИЧЕСКИЙ КОМПЛЕКС. Основы лингвистических знаний. Этап 2. Основы прикладной лингвистики ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ Государственное образовательное учреждение высшего профессионального образования «Уральский государственный университет им. А.М. Горького» ИОНЦ «Русский язык» филологический

Подробнее

Системы информационного обеспечения для проведения распределенных научных исследований

Системы информационного обеспечения для проведения распределенных научных исследований Системы информационного обеспечения для проведения распределенных научных исследований План доклада Задачи систем информационного обеспечения распределенных научных исследований Тематический поиск информации

Подробнее

Введение в обработку естественного языка. Павел Браславский

Введение в обработку естественного языка. Павел Браславский Введение в обработку естественного языка Павел Браславский ЧТО ТАКОЕ ОЕЯ? Термины Computational linguistics / математическая/компьютерная лингвистика Natural language processing / обработка естественного

Подробнее

Автоматическая классификация текстовых документов с помощью онтологий

Автоматическая классификация текстовых документов с помощью онтологий УДК 005 Автоматическая классификация текстовых документов с помощью онтологий # 09, сентябрь 2012 Грушин М.А. Научный руководитель: д.т.н., профессор, Норенков И.П. МГТУ им. Н.Э.Баумана, Москва, Россия

Подробнее

Реализация и исследование методов автоматической кластеризации текстовых документов с помощью методов машинного обучения

Реализация и исследование методов автоматической кластеризации текстовых документов с помощью методов машинного обучения УДК 004.93'1 Реализация и исследование методов автоматической кластеризации текстовых документов с помощью методов машинного обучения Лыфенко Н.Д., аспирант Россия, 125993, г. Москва, Российский государственный

Подробнее

Лингвистика длинного хвоста. Николай Григорьев Отдел голосовых технологий

Лингвистика длинного хвоста. Николай Григорьев Отдел голосовых технологий Лингвистика длинного хвоста Николай Григорьев Отдел голосовых технологий Устройство Web-поиска Индекс: архив документов обратный индекс: по слову выдает все содержащие его документы данные о документах

Подробнее

Выделение ключевых слов в русскоязычных текстах

Выделение ключевых слов в русскоязычных текстах УДК 004.3 Выделение ключевых слов в русскоязычных текстах Ершов Ю.С., бакалавр Россия, 105005, г. Москва, МГТУ им. Н.Э. Баумана, кафедра «Программное обеспечение ЭВМ и информационные технологии» Научный

Подробнее

Использование ресурсов Интернета для построения таксономии

Использование ресурсов Интернета для построения таксономии Использование ресурсов Интернета для построения таксономии Екатерина.Черняк, Борис Миркин Отделение Прикладной Математики и Информатики Национальный Исследовательский Университет Высшая Школа Экономики

Подробнее

Синтез текстовой информации на английском языке при решении задач дистанционного обучения иностранному языку с использованием объектного подхода.

Синтез текстовой информации на английском языке при решении задач дистанционного обучения иностранному языку с использованием объектного подхода. Синтез текстовой информации на английском языке при решении задач дистанционного обучения иностранному языку с использованием объектного подхода. Н.В. Крапухина 1, С.Ю. Кулехин 2 В работе представлено

Подробнее

АНАЛИЗ ТОНАЛЬНОСТИ ТЕКСТА

АНАЛИЗ ТОНАЛЬНОСТИ ТЕКСТА САНКТ- ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ МАТЕМАТИКО- МЕХАНИЧЕСКИЙ ФАКУЛЬТЕТ КАФЕДРА СИСТЕМНОГО ПРОГРАММИРОВАНИЯ АНАЛИЗ ТОНАЛЬНОСТИ ТЕКСТА КУРСОВАЯ РАБОТА СТУДЕНТА 361 ГРУППЫ КАЛМЫКОВА АЛЕКСЕЯ ВЛАДИМИРОВИЧА

Подробнее

О РАЗРАБОТКЕ РУССКО-АНГЛИЙСКОГО ТЕЗАУРУСА ПО КОМПЬЮТЕРНОЙ ЛИНГВИСТИКЕ

О РАЗРАБОТКЕ РУССКО-АНГЛИЙСКОГО ТЕЗАУРУСА ПО КОМПЬЮТЕРНОЙ ЛИНГВИСТИКЕ О РАЗРАБОТКЕ РУССКО-АНГЛИЙСКОГО ТЕЗАУРУСА ПО КОМПЬЮТЕРНОЙ ЛИНГВИСТИКЕ Загорулько Ю.А., Боровикова О.И., Кононенко И.С., Соколова Е.Г. Институт систем информатики имени А.П. Ершова СО РАН, Новосибирск Российский

Подробнее

Автоматическое извлечение правил для снятия морфологической неоднозначности

Автоматическое извлечение правил для снятия морфологической неоднозначности Автоматическое извлечение правил для снятия морфологической неоднозначности Екатерина Протопопова, Виктор Бочаров СПбГУ, Санкт-Петербург, Россия, protoev@gmail.com, victor.bocharov@gmail.com Аннотация.

Подробнее

Основы лингвистического обеспечения АСОИУ

Основы лингвистического обеспечения АСОИУ Основы лингвистического обеспечения АСОИУ Лекция 1 Компьютерная лингвистика К.т.н., доцент Филиппович Анна Юрьевна Лингвистика Лингвистика (от лат. lingua - язык) это наука о языке. Лингвистика = языкознание

Подробнее

ПОДХОД К СОЗДАНИЮ МНОГОЯЗЫЧНЫХ ПАРАЛЛЕЛЬНЫХ КОРПУСОВ ВЕБ-ПУБЛИКАЦИЙ

ПОДХОД К СОЗДАНИЮ МНОГОЯЗЫЧНЫХ ПАРАЛЛЕЛЬНЫХ КОРПУСОВ ВЕБ-ПУБЛИКАЦИЙ Конференция «Диалог 2009» ПОДХОД К СОЗДАНИЮ МНОГОЯЗЫЧНЫХ ПАРАЛЛЕЛЬНЫХ КОРПУСОВ ВЕБ-ПУБЛИКАЦИЙ Д.В. Ландэ, В.В. Жигало Информационный центр «ЭЛВИСТИ» ПРОБЛЕМАТИКА Описывается метод, с помощью которого реализуется

Подробнее

Отчет по курсовой работе «Повышение прозрачности сайта госзакупок РФ»

Отчет по курсовой работе «Повышение прозрачности сайта госзакупок РФ» СПБГУ Кафедра системного программирования Отчет по курсовой работе «Повышение прозрачности сайта госзакупок РФ» Студент: Коноплев Юрий 445гр. Научный руководитель: кандидат физ-мат. наук Сергей Сысоев

Подробнее

Словарь лексических валентностей в системе русскобелорусского

Словарь лексических валентностей в системе русскобелорусского Воронович В.В. Словарь лексических валентностей в системе русско-белорусского машинного перевода // Третьи чтения, посвященные памяти профессора В.А.Карпова. Сборник научных статей. Мн., 2009, с.108-111.

Подробнее

4. Экзаменационный билет включает два вопроса из разных областей лингвистической науки. Образец экзаменационного билета прилагается.

4. Экзаменационный билет включает два вопроса из разных областей лингвистической науки. Образец экзаменационного билета прилагается. ПОЛОЖЕНИЕ об итоговом междисциплинарном экзамене «Теоретическая лингвистика» Специальность 031301 «Теоретическая и прикладная лингвистика» Квалификация специалиста «Лингвист» (ГОС ВПО от 14 марта 2000)

Подробнее

ЛИНГВИСТИКА ТЕКСТА И МАШИННЫЙ ПЕРЕВОД

ЛИНГВИСТИКА ТЕКСТА И МАШИННЫЙ ПЕРЕВОД УДК 800:681.3 А.Т.АБДЫШОВА ЛИНГВИСТИКА ТЕКСТА И МАШИННЫЙ ПЕРЕВОД Бул макалада тексттерди автоматикалык турдо иштетуу формаларын машиналык котормону колдонуулуп концептуалдуу суроолор каралган.илимий техникалык

Подробнее

Автоматическое построение онтологии по коллекции текстовых документов

Автоматическое построение онтологии по коллекции текстовых документов Автоматическое построение онтологии по коллекции текстовых документов Мозжерина Елена Станиславовна аспир., ассистент каф. Технологии Программирования ф-та ПМ-ПУ, СПбГУ 1 Информационный взрыв M. Hilbert

Подробнее

Как и зачем мы делаем Открытый корпус

Как и зачем мы делаем Открытый корпус Как и зачем мы делаем Открытый корпус В. В. Бочаров Д. В. Грановский Mathlingvo 14 мая 2011 г. Жизненный цикл текста 1 Исходный текст под лицензией, совместимой с CC-BY-SA проходит вычитку делится на абзацы,

Подробнее

Рабочая программа дисциплины «Компьютерная лингвистика и анализ текста»

Рабочая программа дисциплины «Компьютерная лингвистика и анализ текста» Федеральное государственное автономное образовательное учреждение высшего образования "Национальный исследовательский университет "Высшая школа экономики" Факультет Компьютерных наук Департамент анализа

Подробнее

К ВОПРОСУ РАЗРАБОТКИ СЛОВАРЕЙ ИНФОРМАЦИОННОЙ СИСТЕМЫ «МАШИННЫЙ ФОНД БЕЛОРУССКОГО ЯЗЫКА»

К ВОПРОСУ РАЗРАБОТКИ СЛОВАРЕЙ ИНФОРМАЦИОННОЙ СИСТЕМЫ «МАШИННЫЙ ФОНД БЕЛОРУССКОГО ЯЗЫКА» Н.К. Рубашко, Г.П. Невмержицкая (Минск, БГУ) К ВОПРОСУ РАЗРАБОТКИ СЛОВАРЕЙ ИНФОРМАЦИОННОЙ СИСТЕМЫ «МАШИННЫЙ ФОНД БЕЛОРУССКОГО ЯЗЫКА» В научно-исследовательской лаборатории интеллектуальных информационных

Подробнее

ОД.01. ВВЕДЕНИЕ В ЯЗЫКОЗНАНИЕ

ОД.01. ВВЕДЕНИЕ В ЯЗЫКОЗНАНИЕ ОБЩИЕ ДИСЦИПЛИНЫ ОД.01. ВВЕДЕНИЕ В ЯЗЫКОЗНАНИЕ Место языка в системе культурно значимых средств коммуникации; способы научного описания языка; история общества и история языка, язык и мысль; язык и культура.

Подробнее

Информатика Информатика наука Предметом информатики Теоретическая информатика

Информатика Информатика наука Предметом информатики Теоретическая информатика Информатика Информатика устанавливает законы преобразования информации в условиях функционирования автоматизированных систем, разрабатывает методы еѐ алгоритмизации, формирования языковых средств общения

Подробнее

Представляемая работа посвящена взаимосвязанным проблемам (плакат 2) выделения единиц знаний из множества (корпуса) тематических текстов и отбора

Представляемая работа посвящена взаимосвязанным проблемам (плакат 2) выделения единиц знаний из множества (корпуса) тематических текстов и отбора Представляемая работа посвящена взаимосвязанным проблемам (плакат 2) выделения единиц знаний из множества (корпуса) тематических текстов и отбора текстов в корпус анализом релевантности исходной фразе.

Подробнее

ПРОГРАММА УЧЕБНОЙ ДИСЦИПЛИНЫ ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ В ФИЛОЛОГИИ Филология. Профиль подготовки: Русский язык. Количество зачетных единиц 4

ПРОГРАММА УЧЕБНОЙ ДИСЦИПЛИНЫ ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ В ФИЛОЛОГИИ Филология. Профиль подготовки: Русский язык. Количество зачетных единиц 4 ПРОГРАММА УЧЕБНОЙ ДИСЦИПЛИНЫ ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ В ФИЛОЛОГИИ для обучающихся по образовательной программе высшего профессионального образования подготовки магистров 45.04.01 Филология Профиль подготовки:

Подробнее

Введение. Обработка естественного языка, или компьютерная лингвистика

Введение. Обработка естественного языка, или компьютерная лингвистика Введение. Обработка естественного языка, или компьютерная лингвистика Компьютерные методы анализа текста Кирилл Александрович Маслинский НИУ ВШЭ Санкт-Петербург 16.01.2013 / 01 Outline Задачи курса Предмет

Подробнее

ТЕХНОЛОГИЯ РАЗРАБОТКИ ТЕМАТИЧЕСКИХ СЛОВАРЕЙ НА ОСНОВЕ СОЧЕТАНИЯ ЛИНГВИСТИЧЕСКИХ И СТАТИСТИЧЕСКИХ МЕТОДОВ

ТЕХНОЛОГИЯ РАЗРАБОТКИ ТЕМАТИЧЕСКИХ СЛОВАРЕЙ НА ОСНОВЕ СОЧЕТАНИЯ ЛИНГВИСТИЧЕСКИХ И СТАТИСТИЧЕСКИХ МЕТОДОВ ТЕХНОЛОГИЯ РАЗРАБОТКИ ТЕМАТИЧЕСКИХ СЛОВАРЕЙ НА ОСНОВЕ СОЧЕТАНИЯ ЛИНГВИСТИЧЕСКИХ И СТАТИСТИЧЕСКИХ МЕТОДОВ Сидорова Е.А. Российский НИИ Искусственного Интеллекта, г. Новосибирск lena@iis.nsk.su Рассматриваемый

Подробнее

ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ

ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ Государственное образовательное учреждение высшего профессионального образования «Уральский государственный университет им. А.М. Горького» ИОНЦ «Русский язык» филологический

Подробнее

Концепция и архитектура тематического интеллектуального научного интернет-ресурса Ю.А. Загорулько, Г. Б. Загорулько, В. К. Шестаков, И. С.

Концепция и архитектура тематического интеллектуального научного интернет-ресурса Ю.А. Загорулько, Г. Б. Загорулько, В. К. Шестаков, И. С. Концепция и архитектура тематического интеллектуального научного интернет-ресурса Ю.А. Загорулько, Г. Б. Загорулько, В. К. Шестаков, И. С. Кононенко Институт систем информатики имени А.П. Ершова СО РАН

Подробнее

Правительство Российской Федерации

Правительство Российской Федерации Правительство Российской Федерации Федеральное государственное автономное образовательное учреждение высшего профессионального образования Национальный исследовательский университет «Высшая школа экономики»

Подробнее

ЭТАПЫ СОЗДАНИЯ СТАТИСТИЧЕСКОГО ПЕРЕВОДЧИКА ПОТОКОВ НОВОСТЕЙ

ЭТАПЫ СОЗДАНИЯ СТАТИСТИЧЕСКОГО ПЕРЕВОДЧИКА ПОТОКОВ НОВОСТЕЙ ЭТАПЫ СОЗДАНИЯ СТАТИСТИЧЕСКОГО ПЕРЕВОДЧИКА ПОТОКОВ НОВОСТЕЙ Ландэ Дмитрий Владимирович, д.т.н., профессор НТУУ «КПИ», зам. директора ElVisti Жигало Владлен Викторович, аспирант, инж.-программист ElVisti

Подробнее

АННОТАЦИЯ рабочей программы учебной дисциплины (модуля) «Современный русский язык» по направлению подготовки Педагогическое образование

АННОТАЦИЯ рабочей программы учебной дисциплины (модуля) «Современный русский язык» по направлению подготовки Педагогическое образование АННОТАЦИЯ рабочей программы учебной дисциплины (модуля) «Современный русский язык» по направлению подготовки 050100 Педагогическое образование 1. Цели освоения дисциплины по профилю подготовки Русский

Подробнее

Факультет компьютерных наук Департамент программной инженерии. Рабочая программа дисциплины Обработка текстов

Факультет компьютерных наук Департамент программной инженерии. Рабочая программа дисциплины Обработка текстов Федеральное государственное автономное образовательное учреждение высшего образования "Национальный исследовательский университет "Высшая школа экономики" Факультет компьютерных наук Департамент программной

Подробнее

Системы автоматического (машинного) перевода текста

Системы автоматического (машинного) перевода текста Системы автоматического (машинного) перевода текста История, основные сведения, описание. Лекция 10 Лингвистическое обеспечение АСОИУ К.т.н., доцент Филиппович Анна Юрьевна Автоматический (машинный) перевод

Подробнее

Автоматическая служба новостей идеи, проблемы, решения

Автоматическая служба новостей идеи, проблемы, решения Автоматическая служба новостей идеи, проблемы, решения Александр АНТОНОВ, Станислав БАГЛЕЙ, Дмитрий ЛАНДЭ Корпорация «ГАЛАКТИКА», Москва, Информационный центр «ЭЛВИСТИ», Киев, Проект WebGround.su Москва-2012

Подробнее

Автоматическая обработка текстов на естественном языке и анализ данных

Автоматическая обработка текстов на естественном языке и анализ данных Большакова Е.И., Воронцов К.В., Ефремова Н.Э., Клышинский Э.С., Лукашевич Н.В., Сапин А.С. Автоматическая обработка текстов на естественном языке и анализ данных НИУ ВШЭ, 2017 год УДК 81 32+004.8 ББК 32.813

Подробнее

ДИСКУРСНЫЙ МЕТОД РАСПОЗНАВАНИЯ СТРУКТУРИРОВАННОСТИ ТЕКСТОВ DISCURSIVE RECOGNITION METHOD OF STRUCTURING TEXTS

ДИСКУРСНЫЙ МЕТОД РАСПОЗНАВАНИЯ СТРУКТУРИРОВАННОСТИ ТЕКСТОВ DISCURSIVE RECOGNITION METHOD OF STRUCTURING TEXTS А.В. Ганичева, А.В. Ганичев Тверская государственная сельскохозяйственная академия, г. Тверь Тверской государственный технический университет, г. Тверь ДИСКУРСНЫЙ МЕТОД РАСПОЗНАВАНИЯ СТРУКТУРИРОВАННОСТИ

Подробнее

Проблемы создания универсального морфосемантического словаря

Проблемы создания универсального морфосемантического словаря УДК 81.322 Проблемы создания универсального морфосемантического словаря С.В. Елкин 1, Э.С. Клышинский 2, С.Е. Стеклянников 3 В работе описываются основы создания универсального морфологического словаря,

Подробнее

Проблемы разработки пользовательских интерфейсов с базами экспертных знаний в интеллектуальных системах

Проблемы разработки пользовательских интерфейсов с базами экспертных знаний в интеллектуальных системах Проблемы разработки пользовательских интерфейсов с базами экспертных знаний в интеллектуальных системах Комарцова Л.Г. Одной из основных проблем, связанных с созданием интеллектуальных систем поддержки

Подробнее

ПРИМЕНЕНИЕ НЕЙРОСЕТЕЙ В ЗАДАЧАХ ТЕКСТОВОЙ АНАЛИТИКИ

ПРИМЕНЕНИЕ НЕЙРОСЕТЕЙ В ЗАДАЧАХ ТЕКСТОВОЙ АНАЛИТИКИ Анатолий СТАРОСТИН, Руководитель Группы исследования технологий извлечения информации ПРИМЕНЕНИЕ НЕЙРОСЕТЕЙ В ЗАДАЧАХ ТЕКСТОВОЙ АНАЛИТИКИ Copyright 2016 ABBYY ABBYY за 30 секунд Дата основания 1989 российская

Подробнее

Автоматическое определение объектов авторской эмоциональной оценки в коротких сообщениях пользователей социальных сетей

Автоматическое определение объектов авторской эмоциональной оценки в коротких сообщениях пользователей социальных сетей Автоматическое определение объектов авторской эмоциональной оценки в коротких сообщениях пользователей социальных сетей Широкова Елена Сергеевна Научные руководители: к.ф. м.н. Турдаков Денис Юрьевич,

Подробнее

Правительство Российской Федерации

Правительство Российской Федерации Правительство Российской Федерации Федеральное государственное автономное образовательное учреждение высшего профессионального образования «Национальный исследовательский университет Высшая школа экономики»

Подробнее

Аннотация. Общая характеристика работы

Аннотация. Общая характеристика работы 3 Аннотация Диссертационная работа посвящена изучению приложений функциональной теории естественного языка и автоматического семантического анализатора проф. В.А. Тузова. Являясь мощным инструментом исследования

Подробнее

УДК Баева Н.В., Большакова Е.И. ПРОБЛЕМЫ АВТОМАТИЗАЦИИ КОНТРОЛЯ УЧЕБНО-НАУЧНЫХ ТЕКСТОВ МГУ им. М.В.Ломоносова, факультет ВМК

УДК Баева Н.В., Большакова Е.И. ПРОБЛЕМЫ АВТОМАТИЗАЦИИ КОНТРОЛЯ УЧЕБНО-НАУЧНЫХ ТЕКСТОВ МГУ им. М.В.Ломоносова, факультет ВМК УДК 681.3 Баева Н.В., Большакова Е.И. ПРОБЛЕМЫ АВТОМАТИЗАЦИИ КОНТРОЛЯ УЧЕБНО-НАУЧНЫХ ТЕКСТОВ МГУ им. М.В.Ломоносова, факультет ВМК Приводится краткий обзор программных систем проверки учебно-научных текстов,

Подробнее

1.Цели и задачи дисциплины.

1.Цели и задачи дисциплины. 1.Цели и задачи дисциплины. 1.1. Цели преподавания дисциплины: Основными целями курса русского языка в колледже являются следующие: закрепить и углубить знания, развивать умения студентов по фонетике,

Подробнее

Ю. Е. КОТЕЛЬНИКОВА ОБРАБОТКА ТЕКСТОВЫХ ДОКУМЕНТОВ И ЭВОЛЮЦИЯ АВТОМАТИЗИРОВАННЫХ СИСТЕМ ПРОЕКТИРОВАНИЯ

Ю. Е. КОТЕЛЬНИКОВА ОБРАБОТКА ТЕКСТОВЫХ ДОКУМЕНТОВ И ЭВОЛЮЦИЯ АВТОМАТИЗИРОВАННЫХ СИСТЕМ ПРОЕКТИРОВАНИЯ УДК 608.01 519.765 Ю. Е. КОТЕЛЬНИКОВА ОБРАБОТКА ТЕКСТОВЫХ ДОКУМЕНТОВ И ЭВОЛЮЦИЯ АВТОМАТИЗИРОВАННЫХ СИСТЕМ ПРОЕКТИРОВАНИЯ Исследованы системы обработки текстовой информации, рассмотрены проблемы анализа

Подробнее

Обзор современных лингвистических технологий и систем

Обзор современных лингвистических технологий и систем УДК 004.023 Обзор современных лингвистических технологий и систем К.И. Якубовский, К.А. Якубовская Московский государственный университет печати имени Ивана Федорова 127550, Москва, ул. Прянишникова, 2А

Подробнее

ИНФОРМАЦИОННАЯ СТРУКТУРА НАУЧНОГО ТЕКСТА. ТЕКСТ В КОНТЕКСТЕ КОЛЛЕКЦИИ

ИНФОРМАЦИОННАЯ СТРУКТУРА НАУЧНОГО ТЕКСТА. ТЕКСТ В КОНТЕКСТЕ КОЛЛЕКЦИИ Л.М. Пивоварова, Е.В. Ягунова (СПбГУ) Информационная структура научного текста. Текст в контексте коллекции // Труды международной конференции «Корпусная лингвистика 2011». СПб.: С.-Петербургский гос.

Подробнее

Аннотированные суффиксные деревья: особенности реализации

Аннотированные суффиксные деревья: особенности реализации Аннотированные суффиксные деревья: особенности реализации Михаил Дубов 1, Екатерина Черняк 2 1 Отделение программной инженерии НИУ ВШЭ, Москва, Россия. msdubov@gmail.com 2 Отделение прикладной математики

Подробнее

Автоматизированное порождение фраз естественного языка, имеющих заданную семантику

Автоматизированное порождение фраз естественного языка, имеющих заданную семантику Автоматизированное порождение фраз естественного языка, имеющих заданную семантику Подготовила: Сазонова Полина, ФИТ НГУ Научный руководитель: Пальчунов Дмитрий Евгеньевич Цель работы Разработка автоматизированных

Подробнее

АНАЛИЗ И ВЫБОР СИСТЕМ АВТОМАТИЗИРОВАННОГО ПЕРЕВОДА

АНАЛИЗ И ВЫБОР СИСТЕМ АВТОМАТИЗИРОВАННОГО ПЕРЕВОДА УДК 004.4 Егоров В. А. студент 4 курс, факультет «Информационных систем и технологий» Поволжский Государственный Университет Телекоммуникаций и Информатики Россия, г.самара АНАЛИЗ И ВЫБОР СИСТЕМ АВТОМАТИЗИРОВАННОГО

Подробнее

Н.В. Лукашевич. Модели и методы автоматической обработки неструктурированной информации на основе базы знаний онтологического типа

Н.В. Лукашевич. Модели и методы автоматической обработки неструктурированной информации на основе базы знаний онтологического типа Московский государственный университет имени М.В. Ломоносова На правах рукописи Н.В. Лукашевич Модели и методы автоматической обработки неструктурированной информации на основе базы знаний онтологического

Подробнее

Открытый лингвопроцессор и его применения в прикладных системах обработки текстов. А.В. Добров, СПбГУ, ООО «Гелайн»

Открытый лингвопроцессор и его применения в прикладных системах обработки текстов. А.В. Добров, СПбГУ, ООО «Гелайн» Открытый лингвопроцессор и его применения в прикладных системах обработки текстов А.В. Добров, СПбГУ, ООО «Гелайн» Функциональность Лингвопроцессор это система, осуществляющая автоматическую обработку

Подробнее

Морфология и синтаксис в задаче семантической кластеризации. Михайлов Д. В., Емельянов Г. М. Новгородский Государственный Университет имени Ярослава

Морфология и синтаксис в задаче семантической кластеризации. Михайлов Д. В., Емельянов Г. М. Новгородский Государственный Университет имени Ярослава Морфология и синтаксис в задаче семантической кластеризации. Михайлов Д. В., Емельянов Г. М. Новгородский Государственный Университет имени Ярослава Мудрого Актуальная глобальная задача, которой посвящена

Подробнее

НЕОБХОДИМОСТЬ ВЫДЕЛЕНИЯ КЛЮЧЕВЫХ СЛОВ ДЛЯ СВЁРТЫВАНИЯ ТЕКСТА

НЕОБХОДИМОСТЬ ВЫДЕЛЕНИЯ КЛЮЧЕВЫХ СЛОВ ДЛЯ СВЁРТЫВАНИЯ ТЕКСТА НЕОБХОДИМОСТЬ ВЫДЕЛЕНИЯ КЛЮЧЕВЫХ СЛОВ ДЛЯ СВЁРТЫВАНИЯ ТЕКСТА Даркулова К.Н., Ергешова Г. Южно-Казахстанский государственный университет им. Мухтара Ауэзова Шымкент, Казахстан В последние десятилетия в

Подробнее

ТЕХНОЛОГИЯ РАЗРАБОТКИ ПРОГРАММНОГО ОБЕСПЕЧЕНИЯ

ТЕХНОЛОГИЯ РАЗРАБОТКИ ПРОГРАММНОГО ОБЕСПЕЧЕНИЯ ТЕХНОЛОГИЯ РАЗРАБОТКИ ПРОГРАММНОГО ОБЕСПЕЧЕНИЯ Разработчик Юн Ф.А., канд. тех. наук. Рецензент Артюшенко В.М., д-р тех. наук, проф. I Организационно-методический раздел 1 Цель дисциплины Цель дисциплины

Подробнее

УДК Желтов Павел Валерианович,

УДК Желтов Павел Валерианович, УДК 004.912 Желтов Павел Валерианович, к.т.н., доцент, ФГБОУ ВО «Чувашский государственный университет им. И.Н. Ульянова, г. Чебоксары, Чувашская Республика; Ятманов Владимир Анатольевич, к.пед.н., ФГБОУ

Подробнее

Машинное обучение и интеллектуальный анализ данных. История

Машинное обучение и интеллектуальный анализ данных. История Машинное обучение и интеллектуальный анализ данных История Содержание История Кибернетика и первые нейронные сети Первые цифровые компьютеры Появление экспертных систем Вероятностный подход Случайный лес

Подробнее

ТЕХНОЛОГИЯ ПОЛНОТЕКСТОВОГО ПОИСКА В МУЛЬТИЯЗЫЧНЫХ СЕТЕВЫХ РЕСУРСАХ

ТЕХНОЛОГИЯ ПОЛНОТЕКСТОВОГО ПОИСКА В МУЛЬТИЯЗЫЧНЫХ СЕТЕВЫХ РЕСУРСАХ T E L ' 2 0 1 2 «Корпусы национальных языков: модели и технологии» ТЕХНОЛОГИЯ ПОЛНОТЕКСТОВОГО ПОИСКА В МУЛЬТИЯЗЫЧНЫХ СЕТЕВЫХ РЕСУРСАХ Д.В. Ландэ 1,2, д.т.н., В.В. Жигало 2 1 Институт проблем регистрации

Подробнее

ПРОГРАММА УЧЕБНОЙ ДИСЦИПЛИНЫ СОВРЕМЕННЫЕ ТЕХНОЛОГИИ ОБРАБОТКИ, ХРАНЕНИЯ И ПЕРЕДАЧИ ФИЛОЛОГИЧЕСКОЙ ИНФОРМАЦИИ Филология

ПРОГРАММА УЧЕБНОЙ ДИСЦИПЛИНЫ СОВРЕМЕННЫЕ ТЕХНОЛОГИИ ОБРАБОТКИ, ХРАНЕНИЯ И ПЕРЕДАЧИ ФИЛОЛОГИЧЕСКОЙ ИНФОРМАЦИИ Филология ПРОГРАММА УЧЕБНОЙ ДИСЦИПЛИНЫ СОВРЕМЕННЫЕ ТЕХНОЛОГИИ ОБРАБОТКИ, ХРАНЕНИЯ И ПЕРЕДАЧИ ФИЛОЛОГИЧЕСКОЙ ИНФОРМАЦИИ для обучающихся по образовательной программе высшего профессионального образования подготовки

Подробнее

Постулат ISSN УДК Семантическая паутина и поисковая оптимизация: особенности взаимодействия

Постулат ISSN УДК Семантическая паутина и поисковая оптимизация: особенности взаимодействия УДК 004.9 Семантическая паутина и поисковая оптимизация: особенности взаимодействия Верхова Ольга Геннадьевна Брянский государственный университет имени академика Ивана Георгиевича Петровского Магистрант

Подробнее

Большакова Е.И. Язык лексико-синтаксических шаблонов LSPL: опыт использования и пути развития

Большакова Е.И. Язык лексико-синтаксических шаблонов LSPL: опыт использования и пути развития Большакова Е.И. Язык лексико-синтаксических шаблонов LSPL: опыт использования и пути развития Введение Задача поиска и извлечения информации из текстов на естественном языке (ЕЯ) все чаще возникает в практике

Подробнее

376 Секция 7. Технологии и системы искусственного интеллекта

376 Секция 7. Технологии и системы искусственного интеллекта 376 Секция 7. Технологии и системы искусственного интеллекта УДК 004.89 А.А. Прокапович, А.А. Егошина Донецкий национальный технический университет, г. Донецк кафедра систем искусственного интеллекта АНАЛИЗ

Подробнее

ЛИНГВИСТИЧЕСКОЕ ОБЕСПЕЧЕНИЕ ИНФОРМАЦИОННЫХ СИСТЕМ

ЛИНГВИСТИЧЕСКОЕ ОБЕСПЕЧЕНИЕ ИНФОРМАЦИОННЫХ СИСТЕМ МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ ФИЛИАЛ ФЕДЕРАЛЬНОГО ГОСУДАРСТВЕННОГО БЮДЖЕТНОГО ОБРАЗОВАТЕЛЬНОГО УЧРЕЖДЕНИЯ ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ «ВЛАДИВОСТОКСКИЙ ГОСУДАРСТВЕННЫЙ

Подробнее

ИТОГИ ПРОЕКТА АЙТИ И ВШЭ ТРИ ЗАДАЧИ ДЛЯ ВУЗА: КАК НЕ ПРОПУСТИТЬ НУЖНЫЙ ГРАНТ ИЛИ КОНКУРС НА НИОКР, НАЙТИ ЭКСПЕРТА В НАУЧНОЙ СРЕДЕ И ВЫЯВИТЬ ПЛАГИАТ

ИТОГИ ПРОЕКТА АЙТИ И ВШЭ ТРИ ЗАДАЧИ ДЛЯ ВУЗА: КАК НЕ ПРОПУСТИТЬ НУЖНЫЙ ГРАНТ ИЛИ КОНКУРС НА НИОКР, НАЙТИ ЭКСПЕРТА В НАУЧНОЙ СРЕДЕ И ВЫЯВИТЬ ПЛАГИАТ ИТОГИ ПРОЕКТА АЙТИ И ВШЭ ТРИ ЗАДАЧИ ДЛЯ ВУЗА: КАК НЕ ПРОПУСТИТЬ НУЖНЫЙ ГРАНТ ИЛИ КОНКУРС НА НИОКР, НАЙТИ ЭКСПЕРТА В НАУЧНОЙ СРЕДЕ И ВЫЯВИТЬ ПЛАГИАТ Дмитрий Романов, директор по развитию технологий информационного

Подробнее

Сайт кафедры: mmp.cs.msu.ru Кафедра математических методов прогнозирования 1 / 13

Сайт кафедры: mmp.cs.msu.ru   Кафедра математических методов прогнозирования 1 / 13 Кафедра математических методов прогнозирования Сайт кафедры: mmp.cs.msu.ru E-mail: mmp@cs.msu.ru Кафедра математических методов прогнозирования mmp@cs.msu.ru 1 / 13 Основные направления деятельности кафедры

Подробнее

МНОГОЦЕЛЕВАЯ СЛОВАРНАЯ ПОДСИСТЕМА ИЗВЛЕЧЕНИЯ ПРЕДМЕТНОЙ ЛЕКСИКИ MULTIPURPOSE DICTIONARY SUBSYSTEM FOR EXTRACTION OF SUBJECT LEXICON

МНОГОЦЕЛЕВАЯ СЛОВАРНАЯ ПОДСИСТЕМА ИЗВЛЕЧЕНИЯ ПРЕДМЕТНОЙ ЛЕКСИКИ MULTIPURPOSE DICTIONARY SUBSYSTEM FOR EXTRACTION OF SUBJECT LEXICON 074-SidorovaE:_Layout 1 13.05.2008 22:54 Page 475 Труды международной конференции «Диалог 2008» МНОГОЦЕЛЕВАЯ СЛОВАРНАЯ ПОДСИСТЕМА ИЗВЛЕЧЕНИЯ ПРЕДМЕТНОЙ ЛЕКСИКИ MULTIPURPOSE DICTIONARY SUBSYSTEM FOR EXTRACTION

Подробнее

ИСПОЛЬЗОВАНИЕ СЛОВАРНОЙ ИНФОРМАЦИИ ПРИ АНАЛИЗЕ ТЕКСТА

ИСПОЛЬЗОВАНИЕ СЛОВАРНОЙ ИНФОРМАЦИИ ПРИ АНАЛИЗЕ ТЕКСТА ИСПОЛЬЗОВАНИЕ СЛОВАРНОЙ ИНФОРМАЦИИ ПРИ АНАЛИЗЕ ТЕКСТА УДК 004.912:303.7 ИСПОЛЬЗОВАНИЕ СЛОВАРНОЙ ИНФОРМАЦИИ ПРИ АНАЛИЗЕ ТЕКСТА К.К. Боярский, Е.А. Каневский, С.К. Стафеев Описаны подходы к решению некоторых

Подробнее

ФОРМАЛИЗАЦИЯ ЯЗЫКА В ЭКСПЕРТНЫХ СИСТЕМАХ

ФОРМАЛИЗАЦИЯ ЯЗЫКА В ЭКСПЕРТНЫХ СИСТЕМАХ Министерство образования Республики Беларусь Учебно-методическое объединение по гуманитарному образованию меститель Министра образования Беларусь А. И. Жук ТД-. X9f! тип. ФОРМАЛИЗАЦИЯ ЯЗЫКА В ЭКСПЕРТНЫХ

Подробнее

Правительство Российской Федерации. Факультет гуманитарных наук Школа лингвистики

Правительство Российской Федерации. Факультет гуманитарных наук Школа лингвистики Правительство Российской Федерации Федеральное государственное автономное образовательное учреждение высшего профессионального образования "Национальный исследовательский университет "Высшая школа экономики"

Подробнее

РОССИЙСКАЯ АКАДЕМИЯ НАУК РАБОЧАЯ ПРОГРАММА. УЧЕБНОЙ ДИСЦИПЛИНЫ «Основы обработки текстовой информации»

РОССИЙСКАЯ АКАДЕМИЯ НАУК РАБОЧАЯ ПРОГРАММА. УЧЕБНОЙ ДИСЦИПЛИНЫ «Основы обработки текстовой информации» РОССИЙСКАЯ АКАДЕМИЯ НАУК Федеральное государственное бюджетное учреждение науки Институт системного программирования Российской академии наук «УТВЕРЖДАЮ» Директор ИСП РАН академик РАН, д.ф.-м.н., профессор

Подробнее

К.К. Боярский, В.П. Захаров, Е.А. Каневский

К.К. Боярский, В.П. Захаров, Е.А. Каневский К.К. Боярский, В.П. Захаров, Е.А. Каневский СНЯТИЕ НЕОДНОЗНАЧНОСТИ МОРФОЛОГИЧЕСКОЙ РАЗМЕТКИ КОРПУСОВ РУССКИХ ТЕКСТОВ 1 1. Характеристика положения в данной области Сравнительно недавно, во второй половине

Подробнее

ВЫПУСКНАЯ КВАЛИФИКАЦИОННАЯ РАБОТА МАГИСТЕРСКАЯ ДИССЕРТАЦИЯ

ВЫПУСКНАЯ КВАЛИФИКАЦИОННАЯ РАБОТА МАГИСТЕРСКАЯ ДИССЕРТАЦИЯ Министерство образования и науки Российской Федерации Федеральное государственное автономное образовательное учреждение высшего образования «Санкт-Петербургский политехнический университет Петра Великого»

Подробнее

Правительство Российской Федерации

Правительство Российской Федерации Правительство Российской Федерации Федеральное государственное автономное образовательное учреждение высшего профессионального образования «Национальный исследовательский университет Высшая школа экономики»

Подробнее

Министерство образования и науки РФ. Гуманитарный факультет кафедра общего и русского языкознания

Министерство образования и науки РФ. Гуманитарный факультет кафедра общего и русского языкознания Министерство образования и науки РФ Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования «Новосибирский национальный исследовательский государственный

Подробнее

PROMT и BIG DATA. Инновации для информационноаналитических. Федор Быков, Руководитель отдела системных разработок

PROMT и BIG DATA. Инновации для информационноаналитических. Федор Быков, Руководитель отдела системных разработок PROMT и BIG DATA Инновации для информационноаналитических систем Федор Быков, Руководитель отдела системных разработок Технологии PROMT для Big Data Передовые решения PROMT в области искусственного интеллекта:

Подробнее

ИССЛЕДОВАНИЕ КОНТЕКСТНОЙ ПРЕДСКАЗУЕМОСТИ ЕДИНИЦ ТЕКСТА С ПОМОЩЬЮ КОРПУСНЫХ РЕСУРСОВ 1

ИССЛЕДОВАНИЕ КОНТЕКСТНОЙ ПРЕДСКАЗУЕМОСТИ ЕДИНИЦ ТЕКСТА С ПОМОЩЬЮ КОРПУСНЫХ РЕСУРСОВ 1 ИССЛЕДОВАНИЕ КОНТЕКСТНОЙ ПРЕДСКАЗУЕМОСТИ ЕДИНИЦ ТЕКСТА С ПОМОЩЬЮ КОРПУСНЫХ РЕСУРСОВ 1 Е.В. Ягунова Во время коммуникативного акта человек непрерывно планирует (программирует) свою речевую деятельность,

Подробнее

Название документа: Рабочая программа по дисциплине «Автоматизированная обработка текстовых массивов» Разработчик Кузнецова И.А. стр.

Название документа: Рабочая программа по дисциплине «Автоматизированная обработка текстовых массивов» Разработчик Кузнецова И.А. стр. Разработчик Кузнецова И.А. стр. 1 из 8 Версия 1 1.Пояснительная записка 1.1 Требования к студентам Для успешного усвния дисциплины «Автоматизированная обработка текстовых массивов» необходимы знания по

Подробнее

ИНТЕГРАЦИЯ МОРФОАНАЛИЗАТОРОВ ДЛЯ АННОТАЦИИ РУССКОЯЗЫЧНЫХ КОРПУСОВ ТЕКСТОВ

ИНТЕГРАЦИЯ МОРФОАНАЛИЗАТОРОВ ДЛЯ АННОТАЦИИ РУССКОЯЗЫЧНЫХ КОРПУСОВ ТЕКСТОВ П.В. Паничева, О.А. Митрофанова ИНТЕГРАЦИЯ МОРФОАНАЛИЗАТОРОВ ДЛЯ АННОТАЦИИ РУССКОЯЗЫЧНЫХ КОРПУСОВ ТЕКСТОВ Морфологическая аннотация русских корпусов и разрешение морфологической неоднозначности задачи,

Подробнее

СИСТЕМА ДЛЯ ПОИСКА И ВЫДЕЛЕНИЯ КОНСТРУКЦИЙ В ТЕКСТАХ НА ЕСТЕСТВЕННОМ ЯЗЫКЕ

СИСТЕМА ДЛЯ ПОИСКА И ВЫДЕЛЕНИЯ КОНСТРУКЦИЙ В ТЕКСТАХ НА ЕСТЕСТВЕННОМ ЯЗЫКЕ УДК 519.688 СИСТЕМА ДЛЯ ПОИСКА И ВЫДЕЛЕНИЯ КОНСТРУКЦИЙ В ТЕКСТАХ НА ЕСТЕСТВЕННОМ ЯЗЫКЕ Е.И. Большакова (bolsh@cs.msu.ru) А.А Носков (alexey.noskov@gmail.com) МГУ им. М.В. Ломоносова, факультет ВМиК Описывается

Подробнее

ТЕХНОЛОГИИ ОБРАБОТКИ ИНФОРМАЦИИ И МЕТОДЫ АВТОМАТИЗИРОВАННОГО РЕФЕРИРОВАНИЯ И АННОТИРОВАНИЯ Жилинская О.И., Чопорова Е.И. Воронежский институт МВД

ТЕХНОЛОГИИ ОБРАБОТКИ ИНФОРМАЦИИ И МЕТОДЫ АВТОМАТИЗИРОВАННОГО РЕФЕРИРОВАНИЯ И АННОТИРОВАНИЯ Жилинская О.И., Чопорова Е.И. Воронежский институт МВД ТЕХНОЛОГИИ ОБРАБОТКИ ИНФОРМАЦИИ И МЕТОДЫ АВТОМАТИЗИРОВАННОГО РЕФЕРИРОВАНИЯ И АННОТИРОВАНИЯ Жилинская О.И., Чопорова Е.И. Воронежский институт МВД России Воронеж, Россия DATA PROCESSING TECHNOLOGIES AND

Подробнее

BUILDING OF NETWORKS OF NATURAL HIERARCHIES OF TERMS BASED ON ANALYSIS OF TEXTS CORPORA

BUILDING OF NETWORKS OF NATURAL HIERARCHIES OF TERMS BASED ON ANALYSIS OF TEXTS CORPORA BUILDING OF NETWORKS OF NATURAL HIERARCHIES OF TERMS BASED ON ANALYSIS OF TEXTS CORPORA D.V. Lande, Institute of Data Recording Problems, NAS Ukraine Summary. The technique of building of networks of hierarchies

Подробнее

Извлечение терминов из русскоязычных текстов при помощи графовых моделей

Извлечение терминов из русскоязычных текстов при помощи графовых моделей Извлечение терминов из русскоязычных текстов при помощи графовых моделей Усталов Дмитрий Алексеевич dmitry@eveel.ru УрФУ, Екатеринбург, Россия Аннотация. Статья посвящена вопросу извлечения терминов из

Подробнее

Роль Онтологии в Технологии Построения Тематических Научных Интернет-ресурсов

Роль Онтологии в Технологии Построения Тематических Научных Интернет-ресурсов Знания-Онтологии-Теории (ЗОНТ-15) Роль Онтологии в Технологии Построения Тематических Научных Интернет-ресурсов Загорулько Ю.А. 1, Боровикова О.И. 1, Загорулько Г.Б. 1 1 Институт систем информатики им.

Подробнее

Шарова Т. В., соискатель Московских В. А., доц., канд. экон. наук Гольдштейн C. JL, проф., д-р техн. наук

Шарова Т. В., соискатель Московских В. А., доц., канд. экон. наук Гольдштейн C. JL, проф., д-р техн. наук Шарова Т. В., соискатель Московских В. А., доц., канд. экон. наук Гольдштейн C. JL, проф., д-р техн. наук ТЕХНОЛОГИЯ АНАЛИЗА ТЕКСТОВ: ТИПОЛОГИЯ ПОНЯТИЙ Актуальность и постановка задачи Развитие систем,

Подробнее