НАУЧНЫЙ СЕМИНАР «КОМПЬЮТЕРНАЯ ЛИНГВИСТИКА и TEXT MINING» Департамент анализа данных и искусственного интеллекта ФКН НИУ ВШЭ

Save this PDF as:
 WORD  PNG  TXT  JPG

Размер: px
Начинать показ со страницы:

Download "НАУЧНЫЙ СЕМИНАР «КОМПЬЮТЕРНАЯ ЛИНГВИСТИКА и TEXT MINING» Департамент анализа данных и искусственного интеллекта ФКН НИУ ВШЭ"

Транскрипт

1 НАУЧНЫЙ СЕМИНАР «КОМПЬЮТЕРНАЯ ЛИНГВИСТИКА и TEXT MINING» Департамент анализа данных и искусственного интеллекта ФКН НИУ ВШЭ

2 НИС КЛиМТ : ПРЕПОДАВАТЕЛИ Большакова Елена Игоревна, к.ф-м.н, доцент Ефремова Наталья Эрнестовна, к.ф-м.н, доцент Черняк Екатерина Леонидовна, м.н.с, преподаватель Ильвовский Дмитрий Алексеевич, м.н.с, преподаватель Департамент Анализа данных и Искусственного интеллекта 2

3 КОМПЬЮТЕРНАЯ ЛИНГВИСТИКА: ОСНОВНАЯ ЗАДАЧА Начало работ 50-е годы 20-го века: машинный перевод Междисциплинарное научное направление: Математика Информатика (Computer Science) Искусственный интеллект (Artificial Intelligence) Лингвистика Основная цель разработка компьютерных программ для автоматической обработки неструктурированных текстов на ЕЯ лингвистических процессоров используют формальные модели языка зависят от конкретного естественного языка например, редактор Word, но не NotePad 3

4 СЛОЖНОСТЬ ЕЯ и ЗАДАЧ КЛ Сложность создания лингвистических процессоров: Многоуровневость любого ЕЯ и текста Неоднозначность единиц ЕЯ Уровни языковой системы: морфологический: слова (словоформы); подуровень морфем (корень, суффикс ) лексический: множество лексем (лексикон) синтаксический: предложения (фразы) семантический (смысловой) и дискурсивный (схематические структуры текста) Каждый уровень правила сочетания единиц Уровни ЕЯ взаимосвязаны 4

5 НЕОДНОЗНАЧНОСТЬ ЕЯ Часто нет однозначной связи единицы языка и ее смысла Полисемия многозначность языковой единицы земля: земля, суша, почва, страна, территория Синонимия совпадение единиц по основному смыслу: о поездке про поездку, горячий жаркий Омонимия звуковое совпадение или совпадение на письме (по форме) двух или более языковых единиц лук оружие/овощ, стих существительное/глагол Еще одна сложность ЕЯ нестандартная сочетаемость единиц на всех уровнях: крепкий чай, но не тяжелый чай (heavy tea) 5

6 МОДЕЛИ ЯЗЫКА Структурные модели учитывают лингвистические особенности одного или несколько уровней ЕЯ Модели морфологии Модели синтаксиса (синтаксические деревья: деревья составляющих, деревья зависимостей) Модели семантики и дискурса Статистические модели опираются на статистику символов /букв и их последовательностей N-грамм слов и их последовательностей: статистическая языковая модель (Language Model) При создании модели вычисляют частоты и вероятности по корпусу/коллекции текстов Комбинированные (гибридные) модели 6

7 ЭТАПЫ ОБРАБОТКИ ТЕКСТА В СТРУКТУРНОЙ МОДЕЛИ ЕЯ Уровни (этапы) анализа текста уровни языковой системы Текст This is a text that represents the meaning shown in the right part of the picture. This is a text that represents the meaning shown in the right part of the picture. This is a text that represents the meaning shown in the right part of the picture. This is a text that represents the meaning shown in the right part of the picture. This is a text that represents the meaning shown in the right part of the picture. This is a text that represents the meaning shown in the right part of the picture. This is a text that represents the meaning shown in the right part of the picture. This is a text that represents the meaning shown in the right part of the picture. This is a text that represents the meaning shown in the right part of the picture. This is a text that represents the Морфологический модуль Язык Синтаксический модуль Семантический модуль Смысл Поверхностное представление Внутреннее представление Морфологическое представление Синтасическое представление 7

8 ЛИНГВИСТИЧЕСКИЕ РЕСУРСЫ Лингвистические процессоры используют: Компьютерные словари: морфологические и др. Грамматики ЕЯ : для синтаксических процессоров Тезаурусы (семантические словари) и онтологии: WordNet Коллекции и корпуса текстов Коллекция набор текстов, собранных по некоторому признаку (нормативно-правовые документы) Лингвистический корпус текстов предназначен для решения лингвистических задач размечен по определенным правилам (морфологическая разметка и др.) примеры корпусов: BrownCorpus, BNC, Национальный корпус РЯ, OpenCorpora 8

9 ПРИКЛАДНЫЕ ЗАДАЧИ КЛ Традиционные направления: Машинный перевод Информационный поиск Реферирование и аннотирование текстов Автоматизация подготовки и редактирования текстов Генерация текстов на ЕЯ Формирование ответов на вопросы Организация диалога с пользователем на ЕЯ Text mining: Извлечение информации из текстов Классификация и кластеризация текстов Извлечение терминов и ключевых слов Извлечение мнений и анализ тональности текстов 9

10 ПОДХОДЫ К РЕШЕНИЮ Инженерный подход: применение структурных моделей, лингвистических правил и шаблонов правила и шаблоны пишут эксперты используются лингвистические ресурсы для записи правил нужны специальные языки и поддерживающие их программные средства: GATE, Томита-парсер, LSPL и др. Машинное обучение: опора на статистические (вероятностные) модели и методы необходима размеченная вручную обучающая текстовая выборка Современная тенденция: комбинирование машинного обучения и инженерного подхода 10

11 МАШИННЫЙ ПЕРЕВОД Джорджтаунский эксперимент, 1954 г.: автоматический перевод с русского на английский Периодизация методов/систем: гг. двуязычные системы, пословный и пословно-пооборотный перевод гг. пофразный перевод гг. многоязычные системы гг. многоязычные системы, использование крупных лексических и терминологических ресурсов 2000 гг. использование статистики, корпусов текстов, статистический машинный перевод Но: проблема полностью автоматического перевода текстов по открытой тематике неразрешима. 11

12 ИНФОРМАЦИОННЫЙ ПОИСК Центральная задача: индексирование документа на ЕЯ, т.е. выделение в нем значимых слов и словосочетаний Смежные задачи информационного поиска: Реферирование текста построение краткого реферата для одного или нескольких тематически связанных текстов Аннотирование текста построение аннотации документа а также задачи: Классификация текстов отнесение к классам с заданными свойствами/параметрами Рубрицирование текстов классификация, соотнесение с иерархической системой классов Кластеризация текстов создание подмножеств близких (например, тематически) документов 12

13 ПРИМЕНЕНИЕ КЛАССИФИКАЦИИ и КЛАСТЕРИЗАЦИИ Упорядочивание и навигация по набору документов составление интернет-каталогов Информационный поиск: ограничение области поиска «интеллектуальная» группировка результатов Фильтрация потока документов: фильтрация спама выявление «искусственных» текстов (боты) определение дубликатов документов Персонализированный/тематический подбор информации: контекстная реклама новости об определенном событии и т.п. 13

14 ИЗВЛЕЧЕНИЕ ИНФОРМАЦИИ ИЗ ТЕКСТОВ Information Extraction (IE): Особенности задачи: Обрабатывается текст, чаще коллекция текстов Извлекаются данные, релевантные определенной проблеме, вопросу, теме Значимые объекты (персоналии, фирмы и т.п.) Атрибуты и отношения объектов, факты и события: прошла встреча, выдан кредит Термины и их связи, ключевые слова: электрический слой Извлеченные данные структурируются визуализируются Приложения: мониторинг новостных лент (сколько кораблей затонуло в текущем году? ) аналитика экономической и производств. деятельности 14

15 OPINION MINING, SENTIMENT ANALYSIS Извлечение мнений и анализ их тональности Мнение общая эмоция, суждение или оценка автора текста по поводу некоторой сущности Тональность эмоциональная оценка, выраженная в тексте по отношению к некоторой сущности в целом или ее частям/свойствам/характеристикам Виды оценок тональности: двоичная (+/ ), троичная (+/ /0), по некоторой шкале Применяется для анализа отзывов/мнений о персонах, политических партиях, товарах, компаниях и др. Последняя тенденция выделение аспектов оцениваемой сущности, например: сущность ресторан, ее аспекты кухня, сервис, интерьер, цена и др. 15

16 АСПЕКТНЫЙ АНАЛИЗ МНЕНИЙ: ВИЗУАЛИЗАЦИЯ 16

17 СЕМИНАР, КУРСОВЫЕ и ВКР Что на самом научном семинаре? лекции (немного) + доклады студентов + обсуждения Итоговая оценка по НИС по сделанным докладам и участию в обсуждениях Возможные темы курсовых и ВКР: извлечение информации о событиях/фактах: (спортивные события: участники соревнования, итог) выявление и визуализация мнений с tripadvisor.ru извлечение терминов для языковых ресурсов построение аннотаций и рефератов документов Есть темы, где требуется не только и не столько программирование и математика 17

18 СПАСИБО ЗА ВНИМАНИЕ! Вопросы? 18

Магистрант: Бименова Жанат Батырбековна Научный руководитель: к.ф.-м.н. Сидорова Елена Анатольевна

Магистрант: Бименова Жанат Батырбековна Научный руководитель: к.ф.-м.н. Сидорова Елена Анатольевна Магистрант: Бименова Жанат Батырбековна Научный руководитель: к.ф.-м.н. Сидорова Елена Анатольевна Разработка методов и средств автоматизации построения тезаурусов предметных областей 1 Цели работы Разработка

Подробнее

Выводы Науч. рук. к.т.н., доц. Звенигородский А.С. Определение биграмм на материале научных текстов по извлечению данных из текстов

Выводы Науч. рук. к.т.н., доц. Звенигородский А.С. Определение биграмм на материале научных текстов по извлечению данных из текстов Рис. 3. Пример сдвига на две позиции Выводы Рассмотренные методы позволяют совершенствовать технологию формирования растровых стереоизображений, а разработанный плагин дает возможность ускорения этого

Подробнее

ориентированных на создание операциональных моделей и ресурсов (корпусов, тезаурусов, онтологий).

ориентированных на создание операциональных моделей и ресурсов (корпусов, тезаурусов, онтологий). ориентированных на создание операциональных моделей и ресурсов (корпусов, тезаурусов, онтологий). Дисциплина (модуль) направлена на формирование компетенций выпускника: способностью к абстрактному мышлению,

Подробнее

Искусственный интеллект как научная область.

Искусственный интеллект как научная область. Искусственный интеллект как научная область. Лекция 1. Специальность : 230105 Предмет изучения. Под Искусственным Интеллектом (ИИ) понимается область исследований, в которой ставится задача изучения и

Подробнее

Ю.А. Загорулько. Институт систем информатики имени А.П. Ершова СО РАН Новосибирск, Россия

Ю.А. Загорулько. Институт систем информатики имени А.П. Ершова СО РАН Новосибирск, Россия Технология обеспечения содержательного доступа к систематизированным знаниям и информационным ресурсам заданной области знаний и средствам их интеллектуальной обработки Ю.А. Загорулько Институт систем

Подробнее

Реализация и исследование методов автоматической кластеризации текстовых документов с помощью методов машинного обучения

Реализация и исследование методов автоматической кластеризации текстовых документов с помощью методов машинного обучения УДК 004.93'1 Реализация и исследование методов автоматической кластеризации текстовых документов с помощью методов машинного обучения Лыфенко Н.Д., аспирант Россия, 125993, г. Москва, Российский государственный

Подробнее

Искусственный интеллект. Компьютерный перевод как один из первых шагов к коммерциализации искусственного интеллекта Юлия Епифанцева PROMT

Искусственный интеллект. Компьютерный перевод как один из первых шагов к коммерциализации искусственного интеллекта Юлия Епифанцева PROMT Искусственный интеллект Компьютерный перевод как один из первых шагов к коммерциализации искусственного интеллекта Юлия Епифанцева PROMT Что такое искусственный интеллект? Искусственный Интеллект (Artificial

Подробнее

УЧЕБНО-МЕТОДИЧЕСКИЙ КОМПЛЕКС. Основы лингвистических знаний. Этап 2. Основы прикладной лингвистики

УЧЕБНО-МЕТОДИЧЕСКИЙ КОМПЛЕКС. Основы лингвистических знаний. Этап 2. Основы прикладной лингвистики ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ Государственное образовательное учреждение высшего профессионального образования «Уральский государственный университет им. А.М. Горького» ИОНЦ «Русский язык» филологический

Подробнее

Системы информационного обеспечения для проведения распределенных научных исследований

Системы информационного обеспечения для проведения распределенных научных исследований Системы информационного обеспечения для проведения распределенных научных исследований План доклада Задачи систем информационного обеспечения распределенных научных исследований Тематический поиск информации

Подробнее

Использование ресурсов Интернета для построения таксономии

Использование ресурсов Интернета для построения таксономии Использование ресурсов Интернета для построения таксономии Екатерина.Черняк, Борис Миркин Отделение Прикладной Математики и Информатики Национальный Исследовательский Университет Высшая Школа Экономики

Подробнее

Выделение ключевых слов в русскоязычных текстах

Выделение ключевых слов в русскоязычных текстах УДК 004.3 Выделение ключевых слов в русскоязычных текстах Ершов Ю.С., бакалавр Россия, 105005, г. Москва, МГТУ им. Н.Э. Баумана, кафедра «Программное обеспечение ЭВМ и информационные технологии» Научный

Подробнее

Синтез текстовой информации на английском языке при решении задач дистанционного обучения иностранному языку с использованием объектного подхода.

Синтез текстовой информации на английском языке при решении задач дистанционного обучения иностранному языку с использованием объектного подхода. Синтез текстовой информации на английском языке при решении задач дистанционного обучения иностранному языку с использованием объектного подхода. Н.В. Крапухина 1, С.Ю. Кулехин 2 В работе представлено

Подробнее

АНАЛИЗ ТОНАЛЬНОСТИ ТЕКСТА

АНАЛИЗ ТОНАЛЬНОСТИ ТЕКСТА САНКТ- ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ МАТЕМАТИКО- МЕХАНИЧЕСКИЙ ФАКУЛЬТЕТ КАФЕДРА СИСТЕМНОГО ПРОГРАММИРОВАНИЯ АНАЛИЗ ТОНАЛЬНОСТИ ТЕКСТА КУРСОВАЯ РАБОТА СТУДЕНТА 361 ГРУППЫ КАЛМЫКОВА АЛЕКСЕЯ ВЛАДИМИРОВИЧА

Подробнее

Автоматическое извлечение правил для снятия морфологической неоднозначности

Автоматическое извлечение правил для снятия морфологической неоднозначности Автоматическое извлечение правил для снятия морфологической неоднозначности Екатерина Протопопова, Виктор Бочаров СПбГУ, Санкт-Петербург, Россия, protoev@gmail.com, victor.bocharov@gmail.com Аннотация.

Подробнее

Как и зачем мы делаем Открытый корпус

Как и зачем мы делаем Открытый корпус Как и зачем мы делаем Открытый корпус В. В. Бочаров Д. В. Грановский Mathlingvo 14 мая 2011 г. Жизненный цикл текста 1 Исходный текст под лицензией, совместимой с CC-BY-SA проходит вычитку делится на абзацы,

Подробнее

ЛИНГВИСТИКА ТЕКСТА И МАШИННЫЙ ПЕРЕВОД

ЛИНГВИСТИКА ТЕКСТА И МАШИННЫЙ ПЕРЕВОД УДК 800:681.3 А.Т.АБДЫШОВА ЛИНГВИСТИКА ТЕКСТА И МАШИННЫЙ ПЕРЕВОД Бул макалада тексттерди автоматикалык турдо иштетуу формаларын машиналык котормону колдонуулуп концептуалдуу суроолор каралган.илимий техникалык

Подробнее

Системы автоматического (машинного) перевода текста

Системы автоматического (машинного) перевода текста Системы автоматического (машинного) перевода текста История, основные сведения, описание. Лекция 10 Лингвистическое обеспечение АСОИУ К.т.н., доцент Филиппович Анна Юрьевна Автоматический (машинный) перевод

Подробнее

Правительство Российской Федерации

Правительство Российской Федерации Правительство Российской Федерации Федеральное государственное автономное образовательное учреждение высшего профессионального образования Национальный исследовательский университет «Высшая школа экономики»

Подробнее

Автоматическое построение онтологии по коллекции текстовых документов

Автоматическое построение онтологии по коллекции текстовых документов Автоматическое построение онтологии по коллекции текстовых документов Мозжерина Елена Станиславовна аспир., ассистент каф. Технологии Программирования ф-та ПМ-ПУ, СПбГУ 1 Информационный взрыв M. Hilbert

Подробнее

ОД.01. ВВЕДЕНИЕ В ЯЗЫКОЗНАНИЕ

ОД.01. ВВЕДЕНИЕ В ЯЗЫКОЗНАНИЕ ОБЩИЕ ДИСЦИПЛИНЫ ОД.01. ВВЕДЕНИЕ В ЯЗЫКОЗНАНИЕ Место языка в системе культурно значимых средств коммуникации; способы научного описания языка; история общества и история языка, язык и мысль; язык и культура.

Подробнее

Отчет по курсовой работе «Повышение прозрачности сайта госзакупок РФ»

Отчет по курсовой работе «Повышение прозрачности сайта госзакупок РФ» СПБГУ Кафедра системного программирования Отчет по курсовой работе «Повышение прозрачности сайта госзакупок РФ» Студент: Коноплев Юрий 445гр. Научный руководитель: кандидат физ-мат. наук Сергей Сысоев

Подробнее

ПРОГРАММА УЧЕБНОЙ ДИСЦИПЛИНЫ ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ В ФИЛОЛОГИИ Филология. Профиль подготовки: Русский язык. Количество зачетных единиц 4

ПРОГРАММА УЧЕБНОЙ ДИСЦИПЛИНЫ ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ В ФИЛОЛОГИИ Филология. Профиль подготовки: Русский язык. Количество зачетных единиц 4 ПРОГРАММА УЧЕБНОЙ ДИСЦИПЛИНЫ ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ В ФИЛОЛОГИИ для обучающихся по образовательной программе высшего профессионального образования подготовки магистров 45.04.01 Филология Профиль подготовки:

Подробнее

УДК Баева Н.В., Большакова Е.И. ПРОБЛЕМЫ АВТОМАТИЗАЦИИ КОНТРОЛЯ УЧЕБНО-НАУЧНЫХ ТЕКСТОВ МГУ им. М.В.Ломоносова, факультет ВМК

УДК Баева Н.В., Большакова Е.И. ПРОБЛЕМЫ АВТОМАТИЗАЦИИ КОНТРОЛЯ УЧЕБНО-НАУЧНЫХ ТЕКСТОВ МГУ им. М.В.Ломоносова, факультет ВМК УДК 681.3 Баева Н.В., Большакова Е.И. ПРОБЛЕМЫ АВТОМАТИЗАЦИИ КОНТРОЛЯ УЧЕБНО-НАУЧНЫХ ТЕКСТОВ МГУ им. М.В.Ломоносова, факультет ВМК Приводится краткий обзор программных систем проверки учебно-научных текстов,

Подробнее

ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ

ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ Государственное образовательное учреждение высшего профессионального образования «Уральский государственный университет им. А.М. Горького» ИОНЦ «Русский язык» филологический

Подробнее

Автоматическая служба новостей идеи, проблемы, решения

Автоматическая служба новостей идеи, проблемы, решения Автоматическая служба новостей идеи, проблемы, решения Александр АНТОНОВ, Станислав БАГЛЕЙ, Дмитрий ЛАНДЭ Корпорация «ГАЛАКТИКА», Москва, Информационный центр «ЭЛВИСТИ», Киев, Проект WebGround.su Москва-2012

Подробнее

ЭТАПЫ СОЗДАНИЯ СТАТИСТИЧЕСКОГО ПЕРЕВОДЧИКА ПОТОКОВ НОВОСТЕЙ

ЭТАПЫ СОЗДАНИЯ СТАТИСТИЧЕСКОГО ПЕРЕВОДЧИКА ПОТОКОВ НОВОСТЕЙ ЭТАПЫ СОЗДАНИЯ СТАТИСТИЧЕСКОГО ПЕРЕВОДЧИКА ПОТОКОВ НОВОСТЕЙ Ландэ Дмитрий Владимирович, д.т.н., профессор НТУУ «КПИ», зам. директора ElVisti Жигало Владлен Викторович, аспирант, инж.-программист ElVisti

Подробнее

Проблемы создания универсального морфосемантического словаря

Проблемы создания универсального морфосемантического словаря УДК 81.322 Проблемы создания универсального морфосемантического словаря С.В. Елкин 1, Э.С. Клышинский 2, С.Е. Стеклянников 3 В работе описываются основы создания универсального морфологического словаря,

Подробнее

Ю. Е. КОТЕЛЬНИКОВА ОБРАБОТКА ТЕКСТОВЫХ ДОКУМЕНТОВ И ЭВОЛЮЦИЯ АВТОМАТИЗИРОВАННЫХ СИСТЕМ ПРОЕКТИРОВАНИЯ

Ю. Е. КОТЕЛЬНИКОВА ОБРАБОТКА ТЕКСТОВЫХ ДОКУМЕНТОВ И ЭВОЛЮЦИЯ АВТОМАТИЗИРОВАННЫХ СИСТЕМ ПРОЕКТИРОВАНИЯ УДК 608.01 519.765 Ю. Е. КОТЕЛЬНИКОВА ОБРАБОТКА ТЕКСТОВЫХ ДОКУМЕНТОВ И ЭВОЛЮЦИЯ АВТОМАТИЗИРОВАННЫХ СИСТЕМ ПРОЕКТИРОВАНИЯ Исследованы системы обработки текстовой информации, рассмотрены проблемы анализа

Подробнее

Правительство Российской Федерации

Правительство Российской Федерации Правительство Российской Федерации Федеральное государственное автономное образовательное учреждение высшего профессионального образования «Национальный исследовательский университет Высшая школа экономики»

Подробнее

Морфология и синтаксис в задаче семантической кластеризации. Михайлов Д. В., Емельянов Г. М. Новгородский Государственный Университет имени Ярослава

Морфология и синтаксис в задаче семантической кластеризации. Михайлов Д. В., Емельянов Г. М. Новгородский Государственный Университет имени Ярослава Морфология и синтаксис в задаче семантической кластеризации. Михайлов Д. В., Емельянов Г. М. Новгородский Государственный Университет имени Ярослава Мудрого Актуальная глобальная задача, которой посвящена

Подробнее

Проблемы разработки пользовательских интерфейсов с базами экспертных знаний в интеллектуальных системах

Проблемы разработки пользовательских интерфейсов с базами экспертных знаний в интеллектуальных системах Проблемы разработки пользовательских интерфейсов с базами экспертных знаний в интеллектуальных системах Комарцова Л.Г. Одной из основных проблем, связанных с созданием интеллектуальных систем поддержки

Подробнее

Аннотированные суффиксные деревья: особенности реализации

Аннотированные суффиксные деревья: особенности реализации Аннотированные суффиксные деревья: особенности реализации Михаил Дубов 1, Екатерина Черняк 2 1 Отделение программной инженерии НИУ ВШЭ, Москва, Россия. msdubov@gmail.com 2 Отделение прикладной математики

Подробнее

ТЕХНОЛОГИЯ РАЗРАБОТКИ ТЕМАТИЧЕСКИХ СЛОВАРЕЙ НА ОСНОВЕ СОЧЕТАНИЯ ЛИНГВИСТИЧЕСКИХ И СТАТИСТИЧЕСКИХ МЕТОДОВ

ТЕХНОЛОГИЯ РАЗРАБОТКИ ТЕМАТИЧЕСКИХ СЛОВАРЕЙ НА ОСНОВЕ СОЧЕТАНИЯ ЛИНГВИСТИЧЕСКИХ И СТАТИСТИЧЕСКИХ МЕТОДОВ ТЕХНОЛОГИЯ РАЗРАБОТКИ ТЕМАТИЧЕСКИХ СЛОВАРЕЙ НА ОСНОВЕ СОЧЕТАНИЯ ЛИНГВИСТИЧЕСКИХ И СТАТИСТИЧЕСКИХ МЕТОДОВ Сидорова Е.А. Российский НИИ Искусственного Интеллекта, г. Новосибирск lena@iis.nsk.su Рассматриваемый

Подробнее

НЕОБХОДИМОСТЬ ВЫДЕЛЕНИЯ КЛЮЧЕВЫХ СЛОВ ДЛЯ СВЁРТЫВАНИЯ ТЕКСТА

НЕОБХОДИМОСТЬ ВЫДЕЛЕНИЯ КЛЮЧЕВЫХ СЛОВ ДЛЯ СВЁРТЫВАНИЯ ТЕКСТА НЕОБХОДИМОСТЬ ВЫДЕЛЕНИЯ КЛЮЧЕВЫХ СЛОВ ДЛЯ СВЁРТЫВАНИЯ ТЕКСТА Даркулова К.Н., Ергешова Г. Южно-Казахстанский государственный университет им. Мухтара Ауэзова Шымкент, Казахстан В последние десятилетия в

Подробнее

ИНФОРМАЦИОННАЯ СТРУКТУРА НАУЧНОГО ТЕКСТА. ТЕКСТ В КОНТЕКСТЕ КОЛЛЕКЦИИ

ИНФОРМАЦИОННАЯ СТРУКТУРА НАУЧНОГО ТЕКСТА. ТЕКСТ В КОНТЕКСТЕ КОЛЛЕКЦИИ Л.М. Пивоварова, Е.В. Ягунова (СПбГУ) Информационная структура научного текста. Текст в контексте коллекции // Труды международной конференции «Корпусная лингвистика 2011». СПб.: С.-Петербургский гос.

Подробнее

Открытый лингвопроцессор и его применения в прикладных системах обработки текстов. А.В. Добров, СПбГУ, ООО «Гелайн»

Открытый лингвопроцессор и его применения в прикладных системах обработки текстов. А.В. Добров, СПбГУ, ООО «Гелайн» Открытый лингвопроцессор и его применения в прикладных системах обработки текстов А.В. Добров, СПбГУ, ООО «Гелайн» Функциональность Лингвопроцессор это система, осуществляющая автоматическую обработку

Подробнее

376 Секция 7. Технологии и системы искусственного интеллекта

376 Секция 7. Технологии и системы искусственного интеллекта 376 Секция 7. Технологии и системы искусственного интеллекта УДК 004.89 А.А. Прокапович, А.А. Егошина Донецкий национальный технический университет, г. Донецк кафедра систем искусственного интеллекта АНАЛИЗ

Подробнее

ТЕХНОЛОГИЯ РАЗРАБОТКИ ПРОГРАММНОГО ОБЕСПЕЧЕНИЯ

ТЕХНОЛОГИЯ РАЗРАБОТКИ ПРОГРАММНОГО ОБЕСПЕЧЕНИЯ ТЕХНОЛОГИЯ РАЗРАБОТКИ ПРОГРАММНОГО ОБЕСПЕЧЕНИЯ Разработчик Юн Ф.А., канд. тех. наук. Рецензент Артюшенко В.М., д-р тех. наук, проф. I Организационно-методический раздел 1 Цель дисциплины Цель дисциплины

Подробнее

Постулат ISSN УДК Семантическая паутина и поисковая оптимизация: особенности взаимодействия

Постулат ISSN УДК Семантическая паутина и поисковая оптимизация: особенности взаимодействия УДК 004.9 Семантическая паутина и поисковая оптимизация: особенности взаимодействия Верхова Ольга Геннадьевна Брянский государственный университет имени академика Ивана Георгиевича Петровского Магистрант

Подробнее

Автоматическое определение объектов авторской эмоциональной оценки в коротких сообщениях пользователей социальных сетей

Автоматическое определение объектов авторской эмоциональной оценки в коротких сообщениях пользователей социальных сетей Автоматическое определение объектов авторской эмоциональной оценки в коротких сообщениях пользователей социальных сетей Широкова Елена Сергеевна Научные руководители: к.ф. м.н. Турдаков Денис Юрьевич,

Подробнее

Правительство Российской Федерации

Правительство Российской Федерации Правительство Российской Федерации Федеральное государственное автономное образовательное учреждение высшего профессионального образования «Национальный исследовательский университет Высшая школа экономики»

Подробнее

СИСТЕМА ДЛЯ ПОИСКА И ВЫДЕЛЕНИЯ КОНСТРУКЦИЙ В ТЕКСТАХ НА ЕСТЕСТВЕННОМ ЯЗЫКЕ

СИСТЕМА ДЛЯ ПОИСКА И ВЫДЕЛЕНИЯ КОНСТРУКЦИЙ В ТЕКСТАХ НА ЕСТЕСТВЕННОМ ЯЗЫКЕ УДК 519.688 СИСТЕМА ДЛЯ ПОИСКА И ВЫДЕЛЕНИЯ КОНСТРУКЦИЙ В ТЕКСТАХ НА ЕСТЕСТВЕННОМ ЯЗЫКЕ Е.И. Большакова (bolsh@cs.msu.ru) А.А Носков (alexey.noskov@gmail.com) МГУ им. М.В. Ломоносова, факультет ВМиК Описывается

Подробнее

ИТОГИ ПРОЕКТА АЙТИ И ВШЭ ТРИ ЗАДАЧИ ДЛЯ ВУЗА: КАК НЕ ПРОПУСТИТЬ НУЖНЫЙ ГРАНТ ИЛИ КОНКУРС НА НИОКР, НАЙТИ ЭКСПЕРТА В НАУЧНОЙ СРЕДЕ И ВЫЯВИТЬ ПЛАГИАТ

ИТОГИ ПРОЕКТА АЙТИ И ВШЭ ТРИ ЗАДАЧИ ДЛЯ ВУЗА: КАК НЕ ПРОПУСТИТЬ НУЖНЫЙ ГРАНТ ИЛИ КОНКУРС НА НИОКР, НАЙТИ ЭКСПЕРТА В НАУЧНОЙ СРЕДЕ И ВЫЯВИТЬ ПЛАГИАТ ИТОГИ ПРОЕКТА АЙТИ И ВШЭ ТРИ ЗАДАЧИ ДЛЯ ВУЗА: КАК НЕ ПРОПУСТИТЬ НУЖНЫЙ ГРАНТ ИЛИ КОНКУРС НА НИОКР, НАЙТИ ЭКСПЕРТА В НАУЧНОЙ СРЕДЕ И ВЫЯВИТЬ ПЛАГИАТ Дмитрий Романов, директор по развитию технологий информационного

Подробнее

РОССИЙСКАЯ АКАДЕМИЯ НАУК РАБОЧАЯ ПРОГРАММА. УЧЕБНОЙ ДИСЦИПЛИНЫ «Основы обработки текстовой информации»

РОССИЙСКАЯ АКАДЕМИЯ НАУК РАБОЧАЯ ПРОГРАММА. УЧЕБНОЙ ДИСЦИПЛИНЫ «Основы обработки текстовой информации» РОССИЙСКАЯ АКАДЕМИЯ НАУК Федеральное государственное бюджетное учреждение науки Институт системного программирования Российской академии наук «УТВЕРЖДАЮ» Директор ИСП РАН академик РАН, д.ф.-м.н., профессор

Подробнее

ИНТЕГРАЦИЯ МОРФОАНАЛИЗАТОРОВ ДЛЯ АННОТАЦИИ РУССКОЯЗЫЧНЫХ КОРПУСОВ ТЕКСТОВ

ИНТЕГРАЦИЯ МОРФОАНАЛИЗАТОРОВ ДЛЯ АННОТАЦИИ РУССКОЯЗЫЧНЫХ КОРПУСОВ ТЕКСТОВ П.В. Паничева, О.А. Митрофанова ИНТЕГРАЦИЯ МОРФОАНАЛИЗАТОРОВ ДЛЯ АННОТАЦИИ РУССКОЯЗЫЧНЫХ КОРПУСОВ ТЕКСТОВ Морфологическая аннотация русских корпусов и разрешение морфологической неоднозначности задачи,

Подробнее

PROMT и BIG DATA. Инновации для информационноаналитических. Федор Быков, Руководитель отдела системных разработок

PROMT и BIG DATA. Инновации для информационноаналитических. Федор Быков, Руководитель отдела системных разработок PROMT и BIG DATA Инновации для информационноаналитических систем Федор Быков, Руководитель отдела системных разработок Технологии PROMT для Big Data Передовые решения PROMT в области искусственного интеллекта:

Подробнее

Министерство образования и науки РФ. Гуманитарный факультет кафедра общего и русского языкознания

Министерство образования и науки РФ. Гуманитарный факультет кафедра общего и русского языкознания Министерство образования и науки РФ Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования «Новосибирский национальный исследовательский государственный

Подробнее

ТЕХНОЛОГИИ ОБРАБОТКИ ИНФОРМАЦИИ И МЕТОДЫ АВТОМАТИЗИРОВАННОГО РЕФЕРИРОВАНИЯ И АННОТИРОВАНИЯ Жилинская О.И., Чопорова Е.И. Воронежский институт МВД

ТЕХНОЛОГИИ ОБРАБОТКИ ИНФОРМАЦИИ И МЕТОДЫ АВТОМАТИЗИРОВАННОГО РЕФЕРИРОВАНИЯ И АННОТИРОВАНИЯ Жилинская О.И., Чопорова Е.И. Воронежский институт МВД ТЕХНОЛОГИИ ОБРАБОТКИ ИНФОРМАЦИИ И МЕТОДЫ АВТОМАТИЗИРОВАННОГО РЕФЕРИРОВАНИЯ И АННОТИРОВАНИЯ Жилинская О.И., Чопорова Е.И. Воронежский институт МВД России Воронеж, Россия DATA PROCESSING TECHNOLOGIES AND

Подробнее

Название документа: Рабочая программа по дисциплине «Автоматизированная обработка текстовых массивов» Разработчик Кузнецова И.А. стр.

Название документа: Рабочая программа по дисциплине «Автоматизированная обработка текстовых массивов» Разработчик Кузнецова И.А. стр. Разработчик Кузнецова И.А. стр. 1 из 8 Версия 1 1.Пояснительная записка 1.1 Требования к студентам Для успешного усвния дисциплины «Автоматизированная обработка текстовых массивов» необходимы знания по

Подробнее

ПРЕДСТАВЛЕНИЕ ЗНАНИЙ В ИНТЕЛЛЕКТУАЛЬНЫХ СИСТЕМАХ

ПРЕДСТАВЛЕНИЕ ЗНАНИЙ В ИНТЕЛЛЕКТУАЛЬНЫХ СИСТЕМАХ ТЕМА ПРЕДСТАВЛЕНИЕ ЗНАНИЙ В ИНТЕЛЛЕКТУАЛЬНЫХ СИСТЕМАХ ОСНОВНЫЕ РАЗДЕЛЫ ТЕМЫ 1. Формализация знаний в интеллектуальных системах. 2. Количественная спецификация ЕЯ систем. 3. Логико-статистические методы

Подробнее

ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ

ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ Государственное образовательное учреждение высшего профессионального образования «Уральский государственный университет им. А.М. Горького» ИОНЦ «Русский язык» филологический

Подробнее

2. Место дисциплины в структуре ОПОП магистратуры.

2. Место дисциплины в структуре ОПОП магистратуры. АННОТАЦИЯ УЧЕБНОЙ ДИСЦИПЛИНЫ Лингвистическая семанантика Направление подготовки 45.03.02 Лингвистика Профиль подготовки «Теория и практика межкультурной коммуникации» 1. Цели и задачи освоения дисциплины:

Подробнее

К.К. Боярский, В.П. Захаров, Е.А. Каневский

К.К. Боярский, В.П. Захаров, Е.А. Каневский К.К. Боярский, В.П. Захаров, Е.А. Каневский СНЯТИЕ НЕОДНОЗНАЧНОСТИ МОРФОЛОГИЧЕСКОЙ РАЗМЕТКИ КОРПУСОВ РУССКИХ ТЕКСТОВ 1 1. Характеристика положения в данной области Сравнительно недавно, во второй половине

Подробнее

ГОСТ (ИСО ) СИБИД. Индексирование документов. Общие требования к координатному индексированию

ГОСТ (ИСО ) СИБИД. Индексирование документов. Общие требования к координатному индексированию ГОСТ 7.66-92 (ИСО 5963-85) СИБИД. Индексирование документов. Общие требования к координатному индексированию ОКСТУ 0007 Дата введения 1993-01-01 Информационные данные 1. РАЗРАБОТАН И ВНЕСЕН Государственным

Подробнее

Извлечение информации. Батыгин Владимир Computer Science Center

Извлечение информации. Батыгин Владимир Computer Science Center Извлечение информации Батыгин Владимир vbatygin@yandex-team.ru Computer Science Center План Что такое Information Extraction Источники данных Подходы Заключение 2 Задачи Named Entity Recognition Disambiguation

Подробнее

Практический опыт применения поисковых технологий для библиотечных фондов

Практический опыт применения поисковых технологий для библиотечных фондов Практический опыт применения поисковых технологий для библиотечных фондов Набатчиков Дмитрий Евгеньевич, ведущий руководитель проектов, Корпорация ЭЛАР, dnabatchikov@elar.ru В докладе рассматриваются потребности

Подробнее

Тихомиров И. А. Смирнов И. В. Институт системного анализа РАН

Тихомиров И. А. Смирнов И. В. Институт системного анализа РАН Применение методов лингвистической семантики и машинного обучения для повышения точности и полноты поиска в поисковой машине «Exactus» Applying linguistic semantics and machine learning methods to search

Подробнее

Роль Онтологии в Технологии Построения Тематических Научных Интернет-ресурсов

Роль Онтологии в Технологии Построения Тематических Научных Интернет-ресурсов Знания-Онтологии-Теории (ЗОНТ-15) Роль Онтологии в Технологии Построения Тематических Научных Интернет-ресурсов Загорулько Ю.А. 1, Боровикова О.И. 1, Загорулько Г.Б. 1 1 Институт систем информатики им.

Подробнее

ПОСТРОЕНИЕ И ИССЛЕДОВАНИЕ РЕШЕТОК ПОНЯТИЙ 2. КРАТКАЯ ТЕОРЕТИЧЕСКАЯ СПРАВКА

ПОСТРОЕНИЕ И ИССЛЕДОВАНИЕ РЕШЕТОК ПОНЯТИЙ 2. КРАТКАЯ ТЕОРЕТИЧЕСКАЯ СПРАВКА ПОСТРОЕНИЕ И ИССЛЕДОВАНИЕ РЕШЕТОК ПОНЯТИЙ Методические указания к лабораторной работе 1. ЦЕЛЬ РАБОТЫ Целью работы является приобретение практических навыков работы с моделями знаний в виде решеток понятий.

Подробнее

«Прикладная и математическая лингвистика»

«Прикладная и математическая лингвистика» ПРОГРАММА ВСТУПИТЕЛЬНОГО ЭКЗАМЕНА ПО СПЕЦИАЛЬНОЙ ДИСЦИПЛИНЕ для поступающих на основную образовательную программу послевузовского профессионального образования (аспирантура) Санкт-Петербургского государственного

Подробнее

ÎÐÃÀÍÈÇÀÖÈß È ÈÑÏÎËÜÇÎÂÀÍÈÅ ÈÍÔÎÐÌÀÖÈÎÍÍÛÕ ÐÅÑÓÐÑÎÂ. 1. Введение. слов и фраз из текста возникает во многих областях: в информационнопоисковых

ÎÐÃÀÍÈÇÀÖÈß È ÈÑÏÎËÜÇÎÂÀÍÈÅ ÈÍÔÎÐÌÀÖÈÎÍÍÛÕ ÐÅÑÓÐÑÎÂ. 1. Введение. слов и фраз из текста возникает во многих областях: в информационнопоисковых ÂÈÍÎÃÐÀÄÎÂÀ Íàäåæäà Âèêòîðîâíà - íà àëüíèê îòäåëà èíôîðìàöèîííûõ ðåñóðñîâ Öåíòðà íàó íî-îáðàçîâàòåëüíûõ ýëåêòðîííûõ ðåñóðñîâ ÔÃÁÎÓ ÂÏÎ «Òâåðñêîé ãîñóäàðñòâåííûé òåõíè åñêèé óíèâåðñèòåò» Àäðåñ: 170023,

Подробнее

Рабочая программа кандидатского экзамена «Теория языка» [Текст] / сост. С.В. Лебедева; Курск. гос. ун-т. Курск, с.

Рабочая программа кандидатского экзамена «Теория языка» [Текст] / сост. С.В. Лебедева; Курск. гос. ун-т. Курск, с. Рецензенты: И.С. Климас, доктор филологических наук, профессор, профессор кафедры русского языка Курского государственного университета; И.С. Бороздина, доктор филологических наук, доцент, доцент кафедры

Подробнее

394 Секция 7. Технологии и системы искусственного интеллекта

394 Секция 7. Технологии и системы искусственного интеллекта 394 Секция 7. Технологии и системы искусственного интеллекта УДК 004.89 Арбузова О.В.,Егошина А.А., Линкин В.О. Донецкий Национальный Технический Университет, г. Донецк кафедра систем искусственного интеллекта

Подробнее

Компьютерная лингвистика в ИППИ: история, современное состояние, перспективы

Компьютерная лингвистика в ИППИ: история, современное состояние, перспективы РОССИЙСКАЯ АКАДЕМИЯ НАУК ИНСТИТУТ ПРОБЛЕМ ПЕРЕДАЧИ ИНФОРМАЦИИ им. А.А.Харкевича Компьютерная лингвистика в ИППИ: история, современное состояние, перспективы Ю.Д.Апресян, И.М.Богуславский, Л.Л.Иомдин Лаборатория

Подробнее

Программа дисциплины

Программа дисциплины МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ Федеральное государственное автономное учреждение высшего профессионального образования "Казанский (Приволжский) федеральный университет" Институт

Подробнее

РАЗРАБОТКА КАЗАХСКО-РУССКОГО СЛОВАРЯ С АВТОМАТИЗИРОВАННЫМ АНАЛИЗОМ КАЗАХСКИХ СЛОВ

РАЗРАБОТКА КАЗАХСКО-РУССКОГО СЛОВАРЯ С АВТОМАТИЗИРОВАННЫМ АНАЛИЗОМ КАЗАХСКИХ СЛОВ РАЗРАБОТКА КАЗАХСКО-РУССКОГО СЛОВАРЯ С АВТОМАТИЗИРОВАННЫМ АНАЛИЗОМ КАЗАХСКИХ СЛОВ Сержанов Азат, гр:7205 Научный руководитель: Сидорова Елена Анатольевна, к.ф.-м.н., ИСИ СО РАН. Введение Казахский язык

Подробнее

Использование естественного языка для обучения мобильного робота

Использование естественного языка для обучения мобильного робота МИНИСТЕРСТВО ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ НОВОСИБИРСКИЙ ГОСУДАРСТВЕННЫЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ Кафедра АППМА Дипломная работа Использование естественного языка для обучения мобильного робота Группа:

Подробнее

Компьютерная морфология в контексте анализа связного текста

Компьютерная морфология в контексте анализа связного текста Компьютерная морфология в контексте анализа связного текста Ермаков А.Е., Плешко В.В. ООО Гарант-Парк-Интернет Доклад посвящен ключевым проблемам морфологического разбора слов в тексте на русском языке.

Подробнее

АНАЛИЗ РУССКОГО ТЕКСТА В СИСТЕМЕ КОМПЬЮТЕРНОГО СУРДОПЕРЕВОДА НА РУССКИЙ РАЗГОВОРНЫЙ ЖЕСТОВЫЙ ЯЗЫК*

АНАЛИЗ РУССКОГО ТЕКСТА В СИСТЕМЕ КОМПЬЮТЕРНОГО СУРДОПЕРЕВОДА НА РУССКИЙ РАЗГОВОРНЫЙ ЖЕСТОВЫЙ ЯЗЫК* СБОРНИК НАУЧНЫХ ТРУДОВ НГТУ. 2011. 1(63). 83 90 УДК 81'33:81: '32 АНАЛИЗ РУССКОГО ТЕКСТА В СИСТЕМЕ КОМПЬЮТЕРНОГО СУРДОПЕРЕВОДА НА РУССКИЙ РАЗГОВОРНЫЙ ЖЕСТОВЫЙ ЯЗЫК* М.Г. ГРИФ, Е.А. ДЕМЬЯНЕНКО Рассмотрена

Подробнее

«Подготовка к ГИА. Теория и практика»

«Подготовка к ГИА. Теория и практика» Муниципальное бюджетное общеобразовательное учреждение «Средняя общеобразовательная школа 7» УТВЕРЖДАЮ Директор МБОУ СОШ 7 Н.В.Киселева 28.08.2014г КАЛЕНДАРНО- ТЕМАТИЧЕСКОЕ ПЛАНИРОВАНИЕ курса по выбору

Подробнее

А.Ю. Антонова, Э.С. Клышинский, Е.В. Ягунова ОПРЕДЕЛЕНИЕ СТИЛЕВЫХ И ЖАНРОВЫХ ХАРАКТЕРИСТИК КОЛЛЕКЦИЙ ТЕКСТОВ НА ОСНОВЕ ЧАСТЕРЕЧНОЙ СОЧЕТАЕМОСТИ 1

А.Ю. Антонова, Э.С. Клышинский, Е.В. Ягунова ОПРЕДЕЛЕНИЕ СТИЛЕВЫХ И ЖАНРОВЫХ ХАРАКТЕРИСТИК КОЛЛЕКЦИЙ ТЕКСТОВ НА ОСНОВЕ ЧАСТЕРЕЧНОЙ СОЧЕТАЕМОСТИ 1 А.Ю. Антонова, Э.С. Клышинский, Е.В. Ягунова ОПРЕДЕЛЕНИЕ СТИЛЕВЫХ И ЖАНРОВЫХ ХАРАКТЕРИСТИК КОЛЛЕКЦИЙ ТЕКСТОВ НА ОСНОВЕ ЧАСТЕРЕЧНОЙ СОЧЕТАЕМОСТИ 1 1. Введение Тексты разных функциональных стилей отличаются

Подробнее

практической подготовки студентов" НМС ЮУрГУ Т.Н. Хомутова РАБОЧАЯ ПРОГРАММА ПРАКТИКИ

практической подготовки студентов НМС ЮУрГУ Т.Н. Хомутова РАБОЧАЯ ПРОГРАММА ПРАКТИКИ Федеральное агентство по образованию Российской Федерации Южно-Уральский государственный университет Кафедра «Общая лингвистика» СОГЛАСОВАНО: Секция "Совершенствован практической подготовки студентов"

Подробнее

1 / 22

1 / 22 Классификация текстов Лекция N 6 курса Современные задачи теоретической информатики Юрий Лифшиц yura@logic.pdmi.ras.ru ИТМО Осень 2005 1 / 22 План лекции 1 Постановка задачи, подходы и применения Постановка

Подробнее

Получить сведения о принципах построения систем автоматической обработки

Получить сведения о принципах построения систем автоматической обработки АВТОМАТИЧЕСКАЯ ОБРАБОТКА ИНФОРМАЦИИ 1 Цели и задачи дисциплины: Дать базовые знания и умения по использованию систем автоматической обработки информации в предстоящей профессиональной деятельности. Обучить

Подробнее

ИННОВАЦИИ В СФЕРЕ ИНФОРМАЦИОННЫХ ТЕХНОЛОГИЙ

ИННОВАЦИИ В СФЕРЕ ИНФОРМАЦИОННЫХ ТЕХНОЛОГИЙ НАУЧНО-ИННОВАЦИОННОЕ ПРЕДПРИЯТИЕ «АДРЭМ» ФГБОУ ВПО «ВОЛОГОДСКИЙ ГОСУДАРСТВЕННЫЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ» Кафедра автоматики и вычислительной техники Кафедра информационных систем и технологий ИННОВАЦИИ

Подробнее

Семантика русского языка

Семантика русского языка Белорусский государственный университет УТВЕРЖДАЮ Проректор по учебной работе А. В. Данильченко..2015 г. Регистрационный УД- /уч. Семантика русского языка Учебная программа учреждения высшего образования

Подробнее

Приложение 2 УЧЕБНО-М ЕТОДИЧЕСКИЕ УКАЗАНИЯ ДЛЯ СТУДЕНТОВ

Приложение 2 УЧЕБНО-М ЕТОДИЧЕСКИЕ УКАЗАНИЯ ДЛЯ СТУДЕНТОВ Приложение 2 УЧЕБНО-М ЕТОДИЧЕСКИЕ УКАЗАНИЯ ДЛЯ СТУДЕНТОВ Для более углубленной подготовки к семинарским занятиям, финальному зачету и выполнению практических заданий рекомендуется не ограничиваться литературой,

Подробнее

План лекции. Классификация текстов Лекция N 6 курса Современные задачи теоретической информатики. Акценты лекции. План лекции

План лекции. Классификация текстов Лекция N 6 курса Современные задачи теоретической информатики. Акценты лекции. План лекции План лекции Классификация текстов Лекция N 6 курса Современные задачи теоретической информатики Юрий Лифшиц yura@logic.pdmi.ras.ru ИТМО Осень 2005 1, подходы и применения 1 / 22 2 / 22 План лекции Акценты

Подробнее

СИСТЕМА АВТОМАТИЧЕСКОГО ПОРОЖДЕНИЯ АНГЛОЯЗЫЧНЫХ ДЕЛОВЫХ ЭЛЕКТРОННЫХ ПИСЕМ. Введение

СИСТЕМА АВТОМАТИЧЕСКОГО ПОРОЖДЕНИЯ АНГЛОЯЗЫЧНЫХ ДЕЛОВЫХ ЭЛЕКТРОННЫХ ПИСЕМ. Введение УДК 004.822:514 СИСТЕМА АВТОМАТИЧЕСКОГО ПОРОЖДЕНИЯ АНГЛОЯЗЫЧНЫХ ДЕЛОВЫХ ЭЛЕКТРОННЫХ ПИСЕМ Т.В. Бусел (tatsiana-busel@yandex.ru) Белорусский государственный лингвистический университет, г. Минск, Республика

Подробнее

ПЕРСПЕКТИВЫ ABBYY COMPRENO НА РОССИЙСКОМ РЫНКЕ: БИЗНЕС-СЦЕНАРИИ, ПРЕИМУЩЕСТВА, ЭФФЕКТИВНОСТЬ РЕШЕНИЙ

ПЕРСПЕКТИВЫ ABBYY COMPRENO НА РОССИЙСКОМ РЫНКЕ: БИЗНЕС-СЦЕНАРИИ, ПРЕИМУЩЕСТВА, ЭФФЕКТИВНОСТЬ РЕШЕНИЙ ПЕРСПЕКТИВЫ ABBYY COMPRENO НА РОССИЙСКОМ РЫНКЕ: БИЗНЕС-СЦЕНАРИИ, ПРЕИМУЩЕСТВА, ЭФФЕКТИВНОСТЬ РЕШЕНИЙ Максим Михайлов, Cтарший вице-президент компании ABBYY Copyright 2015 ABBYY ABBYY разработчик решений

Подробнее

Известия Самарского научного центра Российской академии наук, т. 12, 4(2), 2010 ИНФОРМАТИКА

Известия Самарского научного центра Российской академии наук, т. 12, 4(2), 2010 ИНФОРМАТИКА ИНФОРМАТИКА УДК 519.7+681.3 МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ ТЕРМИНОЛОГИЧЕСКИХ СИСТЕМ ДОКУМЕНТОВ В САПР 2010 И.В. Арзамасцева Ульяновский государственный технический университет Поступила в редакцию 14.05.2010

Подробнее

Муниципальное бюджетное общеобразовательное учреждение «Средняя общеобразовательная школа 1»

Муниципальное бюджетное общеобразовательное учреждение «Средняя общеобразовательная школа 1» Муниципальное бюджетное общеобразовательное учреждение «Средняя общеобразовательная школа 1» РАССМОТРЕНО УТВЕРЖДЕНО на заседании ШМО Методическим советом учителей русского языка МБОУ СОШ 1 и литературы

Подробнее

Обеспечение методической литературой направления «Лингвистика» профиль «Перевод и переводоведение».

Обеспечение методической литературой направления «Лингвистика» профиль «Перевод и переводоведение». Обеспечение методической литературой направления «Лингвистика» профиль «Перевод и переводоведение». Дисциплина Методическое обеспечение История 1. Сивков С.М. История. Тестовые задания по контролю знаний

Подробнее

Содержание 1. ОСНОВНЫЕ ХАРАКТЕРИСТИКИ ПРОГРАММЫ ЦЕЛЬ ПРОГРАММЫ ПЛАНИРУЕМЫЕ РЕЗУЛЬТАТЫ ОБУЧЕНИЯ СОДЕРЖАНИЕ ПРОГРАММЫ

Содержание 1. ОСНОВНЫЕ ХАРАКТЕРИСТИКИ ПРОГРАММЫ ЦЕЛЬ ПРОГРАММЫ ПЛАНИРУЕМЫЕ РЕЗУЛЬТАТЫ ОБУЧЕНИЯ СОДЕРЖАНИЕ ПРОГРАММЫ Содержание 1. ОСНОВНЫЕ ХАРАКТЕРИСТИКИ ПРОГРАММЫ... 3 2. ЦЕЛЬ ПРОГРАММЫ... 3 3. ПЛАНИРУЕМЫЕ РЕЗУЛЬТАТЫ ОБУЧЕНИЯ... 3 4. СОДЕРЖАНИЕ ПРОГРАММЫ... 5 4.1. Планируемый календарный учебный график... 5 4.2. Рабочие

Подробнее

ПОЯСНИТЕЛЬНАЯ ЗАПИСКА

ПОЯСНИТЕЛЬНАЯ ЗАПИСКА ПОЯСНИТЕЛЬНАЯ ЗАПИСКА Элективный курс по русскому языку «Практикум по русскому языку. Подготовка к ОГЭ» предназначен для обучающихся 8 класса. Цель изучения курса формирование языковой и лингвистической

Подробнее

УДК А.Г. Подвесовский, Д.В. Будыльский

УДК А.Г. Подвесовский, Д.В. Будыльский УДК 004.83 А.Г. Подвесовский, Д.В. Будыльский ПРОБЛЕМЫ И ОСОБЕННОСТИ АВТОМАТИЗАЦИИ МОНИТОРИНГА СОЦИАЛЬНЫХ СЕТЕЙ И ИНТЕЛЛЕКТУАЛЬНОЙ ОБРАБОТКИ ПОЛЬЗОВАТЕЛЬСКИХ СООБЩЕНИЙ Разработана модель мониторинга мнений

Подробнее

СТАТИСТИЧЕСКИЕ МЕТОДЫ АНАЛИЗА ЯЗЫКА КАК СПОСОБ ПОВЫШЕНИЯ ЭФФЕКТИВНОСТИ ГЕНЕРАЦИИ ЯЗЫКА ПО ШАБЛОНАМ ИЗ МНОГОМЕРНЫХ БАЗ ДАННЫХ

СТАТИСТИЧЕСКИЕ МЕТОДЫ АНАЛИЗА ЯЗЫКА КАК СПОСОБ ПОВЫШЕНИЯ ЭФФЕКТИВНОСТИ ГЕНЕРАЦИИ ЯЗЫКА ПО ШАБЛОНАМ ИЗ МНОГОМЕРНЫХ БАЗ ДАННЫХ УДК 004.9 СТАТИСТИЧЕСКИЕ МЕТОДЫ АНАЛИЗА ЯЗЫКА КАК СПОСОБ ПОВЫШЕНИЯ ЭФФЕКТИВНОСТИ ГЕНЕРАЦИИ ЯЗЫКА ПО ШАБЛОНАМ ИЗ МНОГОМЕРНЫХ БАЗ ДАННЫХ Маглинец А.Ю., Личаргин Д.В. научный руководитель канд. техн. наук

Подробнее

бизнес-сценарий AviComp Services Семантические метаданные для веб-порталов

бизнес-сценарий AviComp Services Семантические метаданные для веб-порталов бизнес-сценарий AviComp Services Семантические метаданные для веб-порталов оглавление что такое семантические метаданные 3 как их создавать и использовать 9 2 что такое семантические метаданные Семантические

Подробнее

ЭВОЛЮЦИЯ ЛИНГВО- СЕМАНТИЧЕСКИХ ПРЕДСТАВЛЕНИЙ В ИНТЕЛЛЕКТУАЛЬНЫХ СИСТЕМАХ НА ОСНОВЕ РАСШИРЕННЫХ СЕМАНТИЧЕСКИХ СЕТЕЙ

ЭВОЛЮЦИЯ ЛИНГВО- СЕМАНТИЧЕСКИХ ПРЕДСТАВЛЕНИЙ В ИНТЕЛЛЕКТУАЛЬНЫХ СИСТЕМАХ НА ОСНОВЕ РАСШИРЕННЫХ СЕМАНТИЧЕСКИХ СЕТЕЙ ЭВОЛЮЦИЯ ЛИНГВО- СЕМАНТИЧЕСКИХ ПРЕДСТАВЛЕНИЙ В ИНТЕЛЛЕКТУАЛЬНЫХ СИСТЕМАХ НА ОСНОВЕ РАСШИРЕННЫХ СЕМАНТИЧЕСКИХ СЕТЕЙ Козеренко Е.Б. kozerenko@mail.ru, Кузнецов И.П. igor-kuz@mtu-net.ru Институт проблем информатики

Подробнее

Анализ формальных понятий и сжатие текстовой информации в задаче автоматизированного контроля знаний. Емельянов Г.М., Михайлов Д.В.

Анализ формальных понятий и сжатие текстовой информации в задаче автоматизированного контроля знаний. Емельянов Г.М., Михайлов Д.В. Анализ формальных понятий и сжатие текстовой информации в задаче автоматизированного контроля знаний. Емельянов Г.М., Михайлов Д.В. Новгородский государственный университет имени Ярослава Мудрого Настоящая

Подробнее

Гибридная технология перевода. Юлия Епифанцева PROMT

Гибридная технология перевода. Юлия Епифанцева PROMT Гибридная технология перевода Юлия Епифанцева PROMT Машинный перевод Машинный (автоматический) перевод процесс перевода текстов с одного естественного языка на другой с помощью компьютерной программы Основные

Подробнее

Дедупликация почтовых адресов с помощью методов обработки естественного языка и машинного обучения.

Дедупликация почтовых адресов с помощью методов обработки естественного языка и машинного обучения. Дедупликация почтовых адресов с помощью методов обработки естественного языка и машинного обучения. Артем Филиппов, Александр Семёнов afilippov@kpmg.ru, alexandrsemenov@kpmg.ru KPMG Москва Аннотация. В

Подробнее

Научный поиск: описание

Научный поиск: описание Научный поиск: описание Система научного поиска ИНФРА-М разработана для оптимизации учебной и исследовательской работы. На основе платформы Znanium.com создан сервис, способный не только находить нужную

Подробнее

Кафедра информационных технологий. Коллектив авторов. НИМ Учебная программа к Разделу Основы информационных технологий

Кафедра информационных технологий. Коллектив авторов. НИМ Учебная программа к Разделу Основы информационных технологий Кафедра информационных технологий Коллектив авторов НИМ Учебная программа к Разделу 5.18.1. Основы информационных технологий Направление 5.18 Подготовка населения по вопросам информационных технологий

Подробнее

Информационная система анализа тональности текстов

Информационная система анализа тональности текстов Информационная система анализа тональности текстов Студент: Никаноров Георгий Максимович Научный руководитель: к.т.н., доц. Филиппович Андрей Юрьевич МГТУ им. Н.Э. Баумана, кафедра ИУ5 Цель работы: Разработка

Подробнее

ПРОГРАММА по ЛЕКСИКОЛОГИИ СОВРЕМЕННОГО ФРАНЦУЗСКОГО ЯЗЫКА

ПРОГРАММА по ЛЕКСИКОЛОГИИ СОВРЕМЕННОГО ФРАНЦУЗСКОГО ЯЗЫКА I. Объяснительная записка ПРОГРАММА по ЛЕКСИКОЛОГИИ СОВРЕМЕННОГО ФРАНЦУЗСКОГО ЯЗЫКА Представляемая программа предназначается для студентов факультетов и отделений педагогических институтов и университетов.

Подробнее

АННОТАЦИЯ ДИСЦИПЛИНЫ 1938, 1939, 1949 Информатика

АННОТАЦИЯ ДИСЦИПЛИНЫ 1938, 1939, 1949 Информатика ГОУ ВПО «ВЛАДИВОСТОКСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ ЭКОНОМИКИ И СЕРВИСА» АННОТАЦИЯ ДИСЦИПЛИНЫ 1938, 1939, 1949 Информатика Цель и задачи дисциплины Целями освоения учебной дисциплины являются получение

Подробнее

Соколовский В. В Государственная публичная научно-техническая библиотека России, Москва, Россия

Соколовский В. В Государственная публичная научно-техническая библиотека России, Москва, Россия Обзор задач и методов смысловой обработки электронных данных, роль метаданных для практических задач смысловой обработки Tasks and Methods of Semantic Processing of Digital Data, the Role of Metadata for

Подробнее

Правительство Российской Федерации. Факультет гуманитарных наук Школа лингвистики. Рабочая программа дисциплины «Научно-исследовательский семинар»

Правительство Российской Федерации. Факультет гуманитарных наук Школа лингвистики. Рабочая программа дисциплины «Научно-исследовательский семинар» Правительство Российской Федерации Федеральное государственное автономное образовательное учреждение высшего профессионального образования "Национальный исследовательский университет "Высшая школа экономики"

Подробнее

Правительство Российской Федерации. Государственное образовательное бюджетное учреждение высшего профессионального образования

Правительство Российской Федерации. Государственное образовательное бюджетное учреждение высшего профессионального образования Правительство Российской Федерации Государственное образовательное бюджетное учреждение высшего профессионального образования «Национальный исследовательский университет Высшая школа экономики» Факультет

Подробнее