Введение. Обработка естественного языка, или компьютерная лингвистика

Размер: px
Начинать показ со страницы:

Download "Введение. Обработка естественного языка, или компьютерная лингвистика"

Транскрипт

1 Введение. Обработка естественного языка, или компьютерная лингвистика Компьютерные методы анализа текста Кирилл Александрович Маслинский НИУ ВШЭ Санкт-Петербург / 01

2 Outline Задачи курса Предмет и метод Языковые знаки и уровни

3 Задачи курса Outline Задачи курса Предмет и метод Языковые знаки и уровни

if ($this->show_pages_images && $page_num < DocShare_Docs::PAGES_IMAGES_LIMIT) { if (! $this->doc['images_node_id']) { continue; } // $snip = Library::get_smart_snippet($text, DocShare_Docs::CHARS_LIMIT_PAGE_IMAGE_TITLE); $snips = Library::get_text_chunks($text, 4); ?>

4 Задачи курса Автоматическая обработка текста в социологических исследованиях??? В социологии много задач, где требуется анализ текстовых данных: Ключевые слова, частотные тренды Автоматическое определение тематики текста Извлечение мнений и оценок / Sentiment analysis Извлечение фактов и отношений Стилистический анализ и атрибуция текста :-) Автоматический анализ текстов!

5 Задачи курса Автоматическая обработка текста в социологических исследованиях??? В социологии много задач, где требуется анализ текстовых данных: :-Ъ У нас есть Интернет: автоматизировать сбор текстов собрать много текстов получить внушительные количественные данные :-( Традиционный контент-анализ слишком дорог :-) Автоматический анализ текстов!

6 Задачи курса Задачи курса State-of-the-art автоматического анализа текстов: Комьпьютер смысл текста не понимает: поиск моделей и приближений круг решенных задач проблемные области и нерешенные вопросы Терминология: необходимый минимум лингвистических терминов ключевые слова для поиска исследований и инструментов Инструментарий: Методы анализа и границы их применимости Существующее ПО для анализа текстов (на русском языке) Существующие лингвистические ресурсы словари, корпуса (на русском языке)

7 Предмет и метод Outline Задачи курса Предмет и метод Языковые знаки и уровни

8 Предмет и метод Исторические задачи компьютерной лингвистики Тест Тьюринга Машинный перевод Распознавание и синтез речи Понимание и синтез текста (диалоговые системы) Информационный поиск и извлечение фактов (Интернет)

9 Предмет и метод Дисциплины и предметные области Обработка естественного языка / Natural language processing Компьютерная лингвистика / Computational linguistics Искусственный интеллект / Artificial Intelligence Машинное обучение / Machine learning Теория формальных языков / Formal languages

10 Языковые знаки и уровни Outline Задачи курса Предмет и метод Языковые знаки и уровни

11 Языковые знаки и уровни Иерархия языковых уровней Терминология: языковой знак (форма : значение) языковой уровень (правила комбинации знаков одного типа) Знаки более высокого уровня строятся из знаков более низкого:

12 Языковые знаки и уровни Иерархия языковых уровней: пример Знаки более высокого уровня строятся из знаков более низкого: фонетика морфология Приведем пример небольшого текста. лексика синтаксис дискурс / текст

13 Языковые знаки и уровни Иерархия языковых уровней: пример Знаки более высокого уровня строятся из знаков более низкого: фонетика фонемы / phonemes Приведем пример /нибал шова/ текста. морфология лексика синтаксис дискурс / текст

14 Языковые знаки и уровни Иерархия языковых уровней: пример Знаки более высокого уровня строятся из знаков более низкого: фонетика морфемы / morphemes Приведем пример /ни-бал ш-ова/ текста. морфология лексика синтаксис дискурс / текст

15 Языковые знаки и уровни Иерархия языковых уровней: пример Знаки более высокого уровня строятся из знаков более низкого: лексема / lexical type Приведем пример небольшой=a=род,ед,полн,муж текста. фонетика морфология лексика синтаксис дискурс / текст

16 Языковые знаки и уровни Иерархия языковых уровней: пример Знаки более высокого уровня строятся из знаков более низкого: непосредственно составляющие / constituents [ S [ NP Приведем [ NP пример [ NP небольшого текста]]]]. фонетика морфология лексика синтаксис дискурс / текст

17 Языковые знаки и уровни Иерархия языковых уровней: пример Знаки более высокого уровня строятся из знаков более низкого: синтаксическое дерево / syntactic tree S фонетика NP морфология лексика V, Приведем NP N, пример NP синтаксис дискурс / текст A, небольшого N, текста

18 Языковые знаки и уровни Иерархия языковых уровней: пример Знаки более высокого уровня строятся из знаков более низкого: фонетика морфология Приведем пример небольшого текста. лексика синтаксис дискурс / текст

19 Языковые знаки и уровни Языковые знаки: резюме фонема минимальная звуковая единица морфема минимальный знак, имеющий содержание словоформа минимальная форма, которую можно употребить изолированно лексема множество парадигматически связанных словоформ

20 Outline Задачи курса Предмет и метод Языковые знаки и уровни

21 Токенизация Терминология: токен / token (единица анализа текста, сегмент) пробельное слово Сколько токенов в этом тексте? Всем приветик! Катюша, не болеть твоим мужчинам Соскучилась я что то по вам всем...

22 Токенизация Терминология: токен / token (единица анализа текста, сегмент) пробельное слово 15? (разделим по пробелам) Всем приветик! Катюша, не болеть твоим мужчинам Соскучилась я что то по вам всем...

23 Токенизация Терминология: токен / token (единица анализа текста, сегмент) пробельное слово 14? (возьмем только слова) Всем приветик! Катюша, не болеть твоим мужчинам Соскучилась я что то по вам всем...

24 Токенизация Терминология: токен / token (единица анализа текста, сегмент) пробельное слово 18? (пунктуация тоже нужна) Всем приветик! Катюша, не болеть твоим мужчинам Соскучилась я что то по вам всем...

25 Токенизация Терминология: токен / token (единица анализа текста, сегмент) пробельное слово 17? (всё-таки исправим ошибку) Всем приветик! Катюша, не болеть твоим мужчинам Соскучилась я что-то по вам всем...

26 Морфологический анализ Терминология: словоформа / wordform (слово в тексте, измененное падеж, время и т.п.) лексема / lexeme (слово в словаре, совокупность всех форм) стемминг / stemming (урезание слова до основы) лемматизация / lemmatization (приведение слова к начальной форме) определение частей речи / part-of-speech tagging Лена, повеселила))))))))))))))))))))) спасибо!

27 Морфологический анализ Терминология: словоформа / wordform (слово в тексте, измененное падеж, время и т.п.) лексема / lexeme (слово в словаре, совокупность всех форм) стемминг / stemming (урезание слова до основы) лемматизация / lemmatization (приведение слова к начальной форме) определение частей речи / part-of-speech tagging основа / stem Лен, повесели))))))))))))))))))))) спасибо!

28 Морфологический анализ Терминология: словоформа / wordform (слово в тексте, измененное падеж, время и т.п.) лексема / lexeme (слово в словаре, совокупность всех форм) стемминг / stemming (урезание слова до основы) лемматизация / lemmatization (приведение слова к начальной форме) определение частей речи / part-of-speech tagging лемма / lemma (нормализованная форма слова) лена=s,имя,жен,од=им,ед повеселить=v,сов=прош,ед,изъяв,жен,пе спасибо=s,сред,неод=(им,ед им,мн род,ед род,мн дат,ед дат,мн вин,ед вин,м

29 Морфологический анализ Терминология: словоформа / wordform (слово в тексте, измененное падеж, время и т.п.) лексема / lexeme (слово в словаре, совокупность всех форм) стемминг / stemming (урезание слова до основы) лемматизация / lemmatization (приведение слова к начальной форме) определение частей речи / part-of-speech tagging Лена/S повеселить/v спасибо/s

30 Проблема снятия омонимии снятие омонимии / word sense disambiguation Лена лен=s,муж,неод=род,ед 6.40 лена=s,имя,жен,од=им,ед 0.00 лена=s,гео,ед,жен,неод=им 0.00 повеселила повеселить=v,сов=прош,ед,изъяв,жен,пе 0.80 спасибо спасибо=s,сред,неод=(им,ед им,мн род,ед род,мн дат,ед дат,мн вин,ед вин,мн твор,ед твор,мн пр,ед пр,мн) 34.20

31 Проблема снятия омонимии снятие омонимии / word sense disambiguation Лена лен=s,муж,неод=род,ед 6.40 лена=s,имя,жен,од=им,ед 0.00 лена=s,гео,ед,жен,неод=им 0.00 повеселила повеселить=v,сов=прош,ед,изъяв,жен,пе 0.80 спасибо спасибо=s,сред,неод=(им,ед им,мн род,ед род,мн дат,ед дат,мн вин,ед вин,мн твор,ед твор,мн пр,ед пр,мн) 34.20

32 Синтаксический анализ сегментация на предложения / sentence splitting выделение групп / chunking поверхностный парсинг / shallow parsing построение синтаксического дерева / full parsing Спасибо за волшебные кулачки Рожать собираюсь в Скандинавии, как и Катюшу.

33 Синтаксический анализ сегментация на предложения / sentence splitting выделение групп / chunking поверхностный парсинг / shallow parsing построение синтаксического дерева / full parsing Спасибо за [ NP волшебные кулачки ] Рожать собираюсь [ PP в Скандинавии ], как и Катюшу.

34 Синтаксический анализ сегментация на предложения / sentence splitting выделение групп / chunking поверхностный парсинг / shallow parsing построение синтаксического дерева / full parsing (S (NP Спасибо (PP за (NP волшебные кулачки)))). (S (VP (VP Рожать собираюсь) (PP в Скандинавии), (S (CONJ как и) (NP Катюшу) ) ).

35 Кореференция Anaphora resolution А у нас наоборот. Няня i, нанятая к Анютке, третирует Дениску. И в некоторых вопросах про Дениску мы с ней i не сходимся. Как бы мне ее i на место поставить. С Анюткой няня адекватна.

36 Извлечение сущностей и отношений Люблю [ ORG 9-ку]. Я в этот раз с [ PERS Просвирниным] рожала. Классный! Хочешь сдам его тебе. У нас даже 2 [ BRAND Макларена ] [ PROD Квест] и [ PROD ХЛР ]. Но как-то не могу себе представить такую малявку в трости. С большой коляской я летала но с сидячкой. Мне чуть коляску не угробили на обратном пути.

37 Извлечение сущностей и отношений Люблю [ ORG 9-ку]. Я в этот раз с [ PERS Просвирниным] рожала. Классный! Хочешь сдам его тебе. У нас даже 2 [ BRAND Макларена ] [ PROD Квест] и [ PROD ХЛР ]. Но как-то не могу себе представить такую малявку в трости. С большой коляской я летала но с сидячкой. Мне чуть коляску не угробили на обратном пути.

38 Извлечение сущностей и отношений Люблю [ ORG 9-ку]. Я в этот раз с [ PERS Просвирниным] рожала. Классный! Хочешь сдам его тебе. У нас даже 2 [ BRAND Макларена ] [ PROD Квест] и [ PROD ХЛР ]. Но как-то не могу себе представить такую малявку в трости. С большой коляской я летала но с сидячкой. Мне чуть коляску не угробили на обратном пути.

39 Извлечение мнений и оценок Sentiment analysis Люблю 9-ку. Я в этот раз с Просвирниным рожала. Классный! Хочешь сдам его тебе. У нас даже 2 Макларена Квест и ХЛР. Но как-то не могу себе представить такую малявку в трости. С большой коляской я летала но с сидячкой. Мне чуть коляску не угробили на обратном пути.

40 Извлечение мнений и оценок Sentiment analysis Люблю 9-ку. Я в этот раз с Просвирниным рожала. Классный! Хочешь сдам его тебе. У нас даже 2 Макларена Квест и ХЛР. Но как-то не могу себе представить такую малявку в трости. С большой коляской я летала но с сидячкой. Мне чуть коляску не угробили на обратном пути.

41 Резюме Токенизация Текст список словоформ. Лемматизация Словоформа лемма, тег Стемминг Словоформа стем Парсинг Список словоформ группы, синтаксическое дерево

42 Заключение Заключение Понимание текста опирается на знания о мире, контекст коммуникации, ожидания читателя и т.п. Компьютер текст не понимает. Типичные методы автоматического анализа текста не опираются на полный анализ всех языковых уровней. Используй всё, что под рукою, и не ищи себе другое.

43 Заключение Заключение Понимание текста опирается на знания о мире, контекст коммуникации, ожидания читателя и т.п. Компьютер текст не понимает. Типичные методы автоматического анализа текста не опираются на полный анализ всех языковых уровней. Используй всё, что под рукою, и не ищи себе другое.

44 Заключение Заключение Понимание текста опирается на знания о мире, контекст коммуникации, ожидания читателя и т.п. Компьютер текст не понимает. Типичные методы автоматического анализа текста не опираются на полный анализ всех языковых уровней. Используй всё, что под рукою, и не ищи себе другое.

45 Инструменты для морфологического анализа русского языка Outline Инструменты для морфологического анализа русского языка

46 Инструменты для морфологического анализа русского языка Стемминг Porter stemmer Stemka

47 Инструменты для морфологического анализа русского языка Лемматизация AOT mystem pymorphy

48 Инструменты для морфологического анализа русского языка Расстановка частеречных тегов TreeTagger TnT thorsten/tnt/

49 Инструменты для морфологического анализа русского языка Задание Задача: составить частотный список лемм. Датасет: Лемматизатор: mystem Частотный анализ:

50 Инструменты для морфологического анализа русского языка Задание к следующему семинару Статья: Ягунова, Пивоварова Природа коллокаций в русском языке

Wordcounts are amazing by Ted Underwood

Wordcounts are amazing by Ted Underwood Часть I Слова Wordcounts are amazing by Ted Underwood We need to remember that words are actually features of a very, very high-level kind. As a thought experiment, I find it useful to compare text mining

Подробнее

Интеллектуальные информационные системы. Тема 2 Морфологический анализ. Павел Исаакович Браславский весенний семестр 2006

Интеллектуальные информационные системы. Тема 2 Морфологический анализ. Павел Исаакович Браславский весенний семестр 2006 Интеллектуальные информационные системы Тема 2 Морфологический анализ Павел Исаакович Браславский pb@imach.uran.ru весенний семестр 2006 План Зачем нужна морфология? Типы морфологической обработки в задачах

Подробнее

Часть II. Последовательности

Часть II. Последовательности Часть II Последовательности N-граммы. Моделирование локального контекста Компьютерные методы анализа текста Кирилл Александрович Маслинский НИУ ВШЭ Санкт-Петербург 14.02.2014 / 04 Outline Контекст Предсказание

Подробнее

Wordcounts are amazing by Ted Underwood

Wordcounts are amazing by Ted Underwood Часть I Слова Wordcounts are amazing by Ted Underwood We need to remember that words are actually features of a very, very high-level kind. As a thought experiment, I find it useful to compare text mining

Подробнее

НАУЧНЫЙ СЕМИНАР «КОМПЬЮТЕРНАЯ ЛИНГВИСТИКА и TEXT MINING» Департамент анализа данных и искусственного интеллекта ФКН НИУ ВШЭ

НАУЧНЫЙ СЕМИНАР «КОМПЬЮТЕРНАЯ ЛИНГВИСТИКА и TEXT MINING» Департамент анализа данных и искусственного интеллекта ФКН НИУ ВШЭ НАУЧНЫЙ СЕМИНАР «КОМПЬЮТЕРНАЯ ЛИНГВИСТИКА и TEXT MINING» Департамент анализа данных и искусственного интеллекта ФКН НИУ ВШЭ НИС КЛиМТ : ПРЕПОДАВАТЕЛИ Большакова Елена Игоревна, к.ф-м.н, доцент Ефремова

Подробнее

Рабочая программа дисциплины «Автоматическая обработка текстов»

Рабочая программа дисциплины «Автоматическая обработка текстов» Федеральное государственное автономное образовательное учреждение высшего образования "Национальный исследовательский университет "Высшая школа экономики" Факультет компьютерных наук Департамент анализа

Подробнее

АНАЛИЗ ТОНАЛЬНОСТИ ТЕКСТА

АНАЛИЗ ТОНАЛЬНОСТИ ТЕКСТА САНКТ- ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ МАТЕМАТИКО- МЕХАНИЧЕСКИЙ ФАКУЛЬТЕТ КАФЕДРА СИСТЕМНОГО ПРОГРАММИРОВАНИЯ АНАЛИЗ ТОНАЛЬНОСТИ ТЕКСТА КУРСОВАЯ РАБОТА СТУДЕНТА 361 ГРУППЫ КАЛМЫКОВА АЛЕКСЕЯ ВЛАДИМИРОВИЧА

Подробнее

ИНТЕГРАЦИЯ МОРФОАНАЛИЗАТОРОВ ДЛЯ АННОТАЦИИ РУССКОЯЗЫЧНЫХ КОРПУСОВ ТЕКСТОВ

ИНТЕГРАЦИЯ МОРФОАНАЛИЗАТОРОВ ДЛЯ АННОТАЦИИ РУССКОЯЗЫЧНЫХ КОРПУСОВ ТЕКСТОВ П.В. Паничева, О.А. Митрофанова ИНТЕГРАЦИЯ МОРФОАНАЛИЗАТОРОВ ДЛЯ АННОТАЦИИ РУССКОЯЗЫЧНЫХ КОРПУСОВ ТЕКСТОВ Морфологическая аннотация русских корпусов и разрешение морфологической неоднозначности задачи,

Подробнее

ИСПОЛЬЗОВАНИЕ СЛОВАРНОЙ ИНФОРМАЦИИ ПРИ АНАЛИЗЕ ТЕКСТА

ИСПОЛЬЗОВАНИЕ СЛОВАРНОЙ ИНФОРМАЦИИ ПРИ АНАЛИЗЕ ТЕКСТА ИСПОЛЬЗОВАНИЕ СЛОВАРНОЙ ИНФОРМАЦИИ ПРИ АНАЛИЗЕ ТЕКСТА УДК 004.912:303.7 ИСПОЛЬЗОВАНИЕ СЛОВАРНОЙ ИНФОРМАЦИИ ПРИ АНАЛИЗЕ ТЕКСТА К.К. Боярский, Е.А. Каневский, С.К. Стафеев Описаны подходы к решению некоторых

Подробнее

Автоматическое извлечение правил для снятия морфологической неоднозначности

Автоматическое извлечение правил для снятия морфологической неоднозначности Автоматическое извлечение правил для снятия морфологической неоднозначности Екатерина Протопопова, Виктор Бочаров СПбГУ, Санкт-Петербург, Россия, protoev@gmail.com, victor.bocharov@gmail.com Аннотация.

Подробнее

Wordcounts are amazing by Ted Underwood

Wordcounts are amazing by Ted Underwood Часть I Слова Wordcounts are amazing by Ted Underwood We need to remember that words are actually features of a very, very high-level kind. As a thought experiment, I find it useful to compare text mining

Подробнее

Морфологический разбор русского языка

Морфологический разбор русского языка Морфологический разбор русского языка Сергей Бартунов 23 ноября 2010 г. План Постановка задачи Примеры использования Обзор решений 1. Алгоритмический стеммер Snowball 2. mystem от Яндекс 3. AOT.ru - автоматическая

Подробнее

Проблемы автоматической морфологии агглютинативных языков и парсер башкирского языка

Проблемы автоматической морфологии агглютинативных языков и парсер башкирского языка Проблемы автоматической морфологии агглютинативных языков и парсер башкирского языка Б. В. Орехов 1, Е. А. Слободян 2 1 Башкирский государственный педагогический университет им. М. Акмуллы, Уфа; Университет

Подробнее

Искусственный интеллект как научная область.

Искусственный интеллект как научная область. Искусственный интеллект как научная область. Лекция 1. Специальность : 230105 Предмет изучения. Под Искусственным Интеллектом (ИИ) понимается область исследований, в которой ставится задача изучения и

Подробнее

Рабочая программа дисциплины «Компьютерная лингвистика и анализ текста»

Рабочая программа дисциплины «Компьютерная лингвистика и анализ текста» Федеральное государственное автономное образовательное учреждение высшего образования "Национальный исследовательский университет "Высшая школа экономики" Факультет Компьютерных наук Департамент анализа

Подробнее

Введение в обработку текстов

Введение в обработку текстов Введение в обработку текстов лекция 1 О курсе Лектор: Турдаков Денис Юрьевич Лекции каждую пятницу в 18.00 ауд. 707 Математический спецкурс для 3-5 курсов. предполагаются минимальные занания линейной алгебры,

Подробнее

Правительство Российской Федерации

Правительство Российской Федерации Правительство Российской Федерации Федеральное государственное автономное образовательное учреждение высшего профессионального образования Национальный исследовательский университет «Высшая школа экономики»

Подробнее

Частеречная разметка слов с использованием гетерогенной нейронной сети и априорной информации

Частеречная разметка слов с использованием гетерогенной нейронной сети и априорной информации УДК 004.934.1 Частеречная разметка слов с использованием гетерогенной нейронной сети и априорной информации Введение Маланин Г.П., студент кафедра «Программное обеспечение ЭВМ и информационные технологии»,

Подробнее

ЛЕКЦИЯ 1. ВВЕДЕНИЕ В КОРПУСНУЮ ЛИНГВИСТИКУ

ЛЕКЦИЯ 1. ВВЕДЕНИЕ В КОРПУСНУЮ ЛИНГВИСТИКУ ЛЕКЦИЯ 1. ВВЕДЕНИЕ В КОРПУСНУЮ ЛИНГВИСТИКУ В.П. Захаров Санкт-Петербургский государственный университет vz1311@yandex.ru Лекция 1 Корпусная лингвистика 2 Понятие корпуса Лингвистический, или языковой,

Подробнее

Машинное обучение. Классификация

Машинное обучение. Классификация Машинное обучение. Классификация Компьютерные методы анализа текста Кирилл Александрович Маслинский НИУ ВШЭ Санкт-Петербург 12.11.2014 / 05 Outline Машинное обучение Задача классификации Деревья принятия

Подробнее

Вычислительная лингвистика

Вычислительная лингвистика Интернет-математика / Спецглавы математики Вычислительная лингвистика Петрозаводский государственный университет Крижановский Андрей Анатольевич andrew.krizhanovsky 1... gmail.com 2 6 сентября 1852 В Манчестере

Подробнее

УЧЕБНО-МЕТОДИЧЕСКИЙ КОМПЛЕКС. Основы лингвистических знаний. Этап 2. Основы прикладной лингвистики

УЧЕБНО-МЕТОДИЧЕСКИЙ КОМПЛЕКС. Основы лингвистических знаний. Этап 2. Основы прикладной лингвистики ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ Государственное образовательное учреждение высшего профессионального образования «Уральский государственный университет им. А.М. Горького» ИОНЦ «Русский язык» филологический

Подробнее

ОД.01. ВВЕДЕНИЕ В ЯЗЫКОЗНАНИЕ

ОД.01. ВВЕДЕНИЕ В ЯЗЫКОЗНАНИЕ ОБЩИЕ ДИСЦИПЛИНЫ ОД.01. ВВЕДЕНИЕ В ЯЗЫКОЗНАНИЕ Место языка в системе культурно значимых средств коммуникации; способы научного описания языка; история общества и история языка, язык и мысль; язык и культура.

Подробнее

Об авторе...10 О рецензентах Предисловие Глава 1. Основы обработки естественного языка Глава 2. Поиск фрагментов текста...

Об авторе...10 О рецензентах Предисловие Глава 1. Основы обработки естественного языка Глава 2. Поиск фрагментов текста... Содержание Об авторе...10 О рецензентах... 11 Предисловие...13 Глава 1. Основы обработки естественного языка...18 Что такое обработка естественного языка...19 Для чего используется обработка естественного

Подробнее

УДК Баева Н.В., Большакова Е.И. ПРОБЛЕМЫ АВТОМАТИЗАЦИИ КОНТРОЛЯ УЧЕБНО-НАУЧНЫХ ТЕКСТОВ МГУ им. М.В.Ломоносова, факультет ВМК

УДК Баева Н.В., Большакова Е.И. ПРОБЛЕМЫ АВТОМАТИЗАЦИИ КОНТРОЛЯ УЧЕБНО-НАУЧНЫХ ТЕКСТОВ МГУ им. М.В.Ломоносова, факультет ВМК УДК 681.3 Баева Н.В., Большакова Е.И. ПРОБЛЕМЫ АВТОМАТИЗАЦИИ КОНТРОЛЯ УЧЕБНО-НАУЧНЫХ ТЕКСТОВ МГУ им. М.В.Ломоносова, факультет ВМК Приводится краткий обзор программных систем проверки учебно-научных текстов,

Подробнее

Правительство Российской Федерации

Правительство Российской Федерации Правительство Российской Федерации Федеральное государственное автономное образовательное учреждение высшего профессионального образования «Национальный исследовательский университет Высшая школа экономики»

Подробнее

Введение в обработку текстов. лекция 1

Введение в обработку текстов. лекция 1 Введение в обработку текстов лекция 1 О курсе Лектор: Турдаков Денис Юрьевич Лекции каждую пятницу в 18.00 ауд. П-6 Математический спецкурс для 3-5 курсов. предполагаются минимальные знания линейной алгебры,

Подробнее

46,0% 33,2% разбора слов Состав слова Умение различать формы слова и родственные слова Б 1 балл 100,0% 71,0% 59,7%

46,0% 33,2% разбора слов Состав слова Умение различать формы слова и родственные слова Б 1 балл 100,0% 71,0% 59,7% по отдельным м (4 класс, конец 2011/2012 учебного года) (курсивом отмечены, проверяющие знания из раздела, который не является обязательным для овладения всеми учащимися) БЛОК 1 1_1 В.1, 1 В.8, 6 1.1.1

Подробнее

Некоторые сложности автоматизированной. процесс лемматизации несловарных словоформ,

Некоторые сложности автоматизированной. процесс лемматизации несловарных словоформ, Некоторые сложности автоматизированной лемматизации несловарных словоформ Some difficulties in automated lemmatization of word forms not contained in the dictionary Клышинский Э. С. (klyshinsky@mail.ru)

Подробнее

Построение морфологического анализатора неизвестных слов на основе словарей системы ЭТАП-3

Построение морфологического анализатора неизвестных слов на основе словарей системы ЭТАП-3 Построение морфологического анализатора неизвестных слов на основе словарей системы ЭТАП-3 Казенников А.О. ИППИ РАH kzn@iitp.ru Аннотация В настоящей работе представлен способ построения морфологического

Подробнее

Корпусная лингвистка. проект Открытый Корпус и место компьютерной лингвистики в народном хозяйстве. Докладчик: Бочаров Виктор

Корпусная лингвистка. проект Открытый Корпус и место компьютерной лингвистики в народном хозяйстве. Докладчик: Бочаров Виктор Корпусная лингвистка проект Открытый Корпус и место компьютерной лингвистики в народном хозяйстве Докладчик: Бочаров Виктор июль 2011 О докладчике Виктор Бочаров: аспирант кафедры математической лингвистики

Подробнее

Выводы Науч. рук. к.т.н., доц. Звенигородский А.С. Определение биграмм на материале научных текстов по извлечению данных из текстов

Выводы Науч. рук. к.т.н., доц. Звенигородский А.С. Определение биграмм на материале научных текстов по извлечению данных из текстов Рис. 3. Пример сдвига на две позиции Выводы Рассмотренные методы позволяют совершенствовать технологию формирования растровых стереоизображений, а разработанный плагин дает возможность ускорения этого

Подробнее

Морфологический анализ. Павел Браславский

Морфологический анализ. Павел Браславский Морфологический анализ Павел Браславский ВВЕДЕНИЕ 2 Морфология Свойства слова и его структура Морфемы значимые единицы в составе слова Словоизменение (inflection) Бегать бегу бежишь бежит бегут бежите

Подробнее

Морфология и синтаксис в задаче семантической кластеризации. Михайлов Д. В., Емельянов Г. М. Новгородский Государственный Университет имени Ярослава

Морфология и синтаксис в задаче семантической кластеризации. Михайлов Д. В., Емельянов Г. М. Новгородский Государственный Университет имени Ярослава Морфология и синтаксис в задаче семантической кластеризации. Михайлов Д. В., Емельянов Г. М. Новгородский Государственный Университет имени Ярослава Мудрого Актуальная глобальная задача, которой посвящена

Подробнее

Математическое обеспечение методов распознавания обр. при обработке текстов на Вьетнамском языке

Математическое обеспечение методов распознавания обр. при обработке текстов на Вьетнамском языке Математическое обеспечение методов распознавания образов при обработке текстов на Вьетнамском языке Научный руководитель: доктор физ.-мат. наук, проф. Граничин Олег Николаевич Математическо-механический

Подробнее

Как и зачем мы делаем Открытый корпус

Как и зачем мы делаем Открытый корпус Как и зачем мы делаем Открытый корпус В. В. Бочаров Д. В. Грановский Mathlingvo 14 мая 2011 г. Жизненный цикл текста 1 Исходный текст под лицензией, совместимой с CC-BY-SA проходит вычитку делится на абзацы,

Подробнее

Нормализация слов русского языка. Докладчик: Оксана Астапова Научный руководитель: Денис Турдаков

Нормализация слов русского языка. Докладчик: Оксана Астапова Научный руководитель: Денис Турдаков Нормализация слов русского языка Докладчик: Оксана Астапова Научный руководитель: Денис Турдаков План Что такое нормализация? Проблемная область Специфика русского языка Существующие решения Что это такое

Подробнее

Компьютерная лингвистика в ИППИ: история, современное состояние, перспективы

Компьютерная лингвистика в ИППИ: история, современное состояние, перспективы РОССИЙСКАЯ АКАДЕМИЯ НАУК ИНСТИТУТ ПРОБЛЕМ ПЕРЕДАЧИ ИНФОРМАЦИИ им. А.А.Харкевича Компьютерная лингвистика в ИППИ: история, современное состояние, перспективы Ю.Д.Апресян, И.М.Богуславский, Л.Л.Иомдин Лаборатория

Подробнее

СИСТЕМА СЛОЖНОГО МОРФОЛОГИЧЕСКОГО ПОИСКА В ПИСЬМЕННОМ КОРПУСЕ ТАТАРСКОГО ЯЗЫКА

СИСТЕМА СЛОЖНОГО МОРФОЛОГИЧЕСКОГО ПОИСКА В ПИСЬМЕННОМ КОРПУСЕ ТАТАРСКОГО ЯЗЫКА СИСТЕМА СЛОЖНОГО МОРФОЛОГИЧЕСКОГО ПОИСКА В ПИСЬМЕННОМ КОРПУСЕ ТАТАРСКОГО ЯЗЫКА М. Р. Сайхунов, Р. Р. Хусаинов, Т. И. Ибрагимов Казань Аннотация. Работа посвящена описанию современного состояния Письменного

Подробнее

РАБОЧАЯ ПРОГРАММА «Связи с общественностью» Москва 2010 г.

РАБОЧАЯ ПРОГРАММА «Связи с общественностью» Москва 2010 г. МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ «РОССИЙСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ ТУРИЗМА И СЕРВИСА»

Подробнее

Ха Ти Чунг УЧЁТ ОСОБЕННОСТЕЙ ВЬЕТНАМСКОГО ЯЗЫКА В СИСТЕМЕ РУССКО-ВЬЕТНАМСКОГО И ВЬЕТНАМСКО-РУССКОГО МАШИННОГО ПЕРЕВОДА

Ха Ти Чунг УЧЁТ ОСОБЕННОСТЕЙ ВЬЕТНАМСКОГО ЯЗЫКА В СИСТЕМЕ РУССКО-ВЬЕТНАМСКОГО И ВЬЕТНАМСКО-РУССКОГО МАШИННОГО ПЕРЕВОДА возможны только на основе типовых технологических решений. Такие решения должны отражать опыт ведущих международных профессиональных консорциумов в области электронного обучения и базироваться на принципах

Подробнее

«Прикладная и математическая лингвистика»

«Прикладная и математическая лингвистика» ПРОГРАММА ВСТУПИТЕЛЬНОГО ЭКЗАМЕНА ПО СПЕЦИАЛЬНОЙ ДИСЦИПЛИНЕ для поступающих на основную образовательную программу послевузовского профессионального образования (аспирантура) Санкт-Петербургского государственного

Подробнее

Анализ статистических алгоритмов снятия морфологической омонимии в русском языке

Анализ статистических алгоритмов снятия морфологической омонимии в русском языке Анализ статистических алгоритмов снятия морфологической омонимии в русском языке Е. Д. Лакомкин 1, И. В. Пузыревский 2, Д. А. Рыжова 3 1 egor.lakomkin@gmail.com, 2 ivan.pouzyrevsky@gmail.com, 3 daria.ryzhova@mail.ru

Подробнее

готовностью принимать нравственные обязательства по отношению к окружающей природе, обществу и культурному наследию;

готовностью принимать нравственные обязательства по отношению к окружающей природе, обществу и культурному наследию; 1 ОК-5 способностью к осознанию значения гуманистических ценностей для сохранения и развития современной цивилизации; готовностью принимать нравственные обязательства по отношению к окружающей природе,

Подробнее

Характеристика профессиональной деятельности выпускников

Характеристика профессиональной деятельности выпускников х> \ университет /s^ // ' ^Ч ft// УТВЕРЖДАЮ по учебной работе А.Б. Безбородов «Ж> OG 2016 г. Аннотация основной образовательной программу высшего профессионального образования по напрэдшжшо подготовки

Подробнее

ПРОГРАММА УЧЕБНОЙ ДИСЦИПЛИНЫ ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ В ФИЛОЛОГИИ Филология. Профиль подготовки: Русский язык. Количество зачетных единиц 4

ПРОГРАММА УЧЕБНОЙ ДИСЦИПЛИНЫ ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ В ФИЛОЛОГИИ Филология. Профиль подготовки: Русский язык. Количество зачетных единиц 4 ПРОГРАММА УЧЕБНОЙ ДИСЦИПЛИНЫ ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ В ФИЛОЛОГИИ для обучающихся по образовательной программе высшего профессионального образования подготовки магистров 45.04.01 Филология Профиль подготовки:

Подробнее

О РАЗРАБОТКЕ РУССКО-АНГЛИЙСКОГО ТЕЗАУРУСА ПО КОМПЬЮТЕРНОЙ ЛИНГВИСТИКЕ

О РАЗРАБОТКЕ РУССКО-АНГЛИЙСКОГО ТЕЗАУРУСА ПО КОМПЬЮТЕРНОЙ ЛИНГВИСТИКЕ О РАЗРАБОТКЕ РУССКО-АНГЛИЙСКОГО ТЕЗАУРУСА ПО КОМПЬЮТЕРНОЙ ЛИНГВИСТИКЕ Загорулько Ю.А., Боровикова О.И., Кононенко И.С., Соколова Е.Г. Институт систем информатики имени А.П. Ершова СО РАН, Новосибирск Российский

Подробнее

Государственное бюджетное учреждение дополнительного образования Псковской области «Псковский областной центр развития одаренных детей и юношества»

Государственное бюджетное учреждение дополнительного образования Псковской области «Псковский областной центр развития одаренных детей и юношества» Государственное бюджетное учреждение дополнительного образования Псковской области «Псковский областной центр развития одаренных детей и юношества» Учебный план отделения русского языка (модуль 1), 16/17

Подробнее

Правительство Российской Федерации. Факультет гуманитарных наук Школа лингвистики. Рабочая программа дисциплины «Научно-исследовательский семинар»

Правительство Российской Федерации. Факультет гуманитарных наук Школа лингвистики. Рабочая программа дисциплины «Научно-исследовательский семинар» Правительство Российской Федерации Федеральное государственное автономное образовательное учреждение высшего профессионального образования "Национальный исследовательский университет "Высшая школа экономики"

Подробнее

Б1.В.ОД.4 Алтайский язык (фонетика, лексика)

Б1.В.ОД.4 Алтайский язык (фонетика, лексика) 1. Цель дисциплины: Б1.В.ОД.4 Алтайский язык (фонетика, лексика) - углубить знания обучающихся о лексико-фразеологическом, фонетическом и морфемном уровнях системы современного алтайского литературного

Подробнее

УДК :303.7 ИСПОЛЬЗОВАНИЕ СЛОВАРНОЙ ИНФОРМАЦИИ ПРИ АНАЛИЗЕ ТЕКСТА К.К. Боярский, Е.А. Каневский, С.К. Стафеев

УДК :303.7 ИСПОЛЬЗОВАНИЕ СЛОВАРНОЙ ИНФОРМАЦИИ ПРИ АНАЛИЗЕ ТЕКСТА К.К. Боярский, Е.А. Каневский, С.К. Стафеев К.К. Боярский, Е.А. Каневский, С.К. Стафеев УДК 004.912:303.7 ИСПОЛЬЗОВАНИЕ СЛОВАРНОЙ ИНФОРМАЦИИ ПРИ АНАЛИЗЕ ТЕКСТА К.К. Боярский, Е.А. Каневский, С.К. Стафеев Описаны подходы к решению некоторых проблем,

Подробнее

Рабочая программа по русскому языку для 7 класса под редакцией Львова С.И., Львова В.В.

Рабочая программа по русскому языку для 7 класса под редакцией Львова С.И., Львова В.В. Рабочая программа по русскому языку для 7 класса под редакцией Львова С.И., Львова В.В. Количество часов в году 170 Количество часов в неделю 5 Количество контрольных плановых уроков 11 Количество уроков

Подробнее

Квантитативные методы в диахронических корпусных исследованиях : конструкции с предикативами и дативным субъектом. А.Бонч-Осмоловская НИУ ВШЭ

Квантитативные методы в диахронических корпусных исследованиях : конструкции с предикативами и дативным субъектом. А.Бонч-Осмоловская НИУ ВШЭ Квантитативные методы в диахронических корпусных исследованиях : конструкции с предикативами и дативным субъектом А.Бонч-Осмоловская НИУ ВШЭ Идеальный предикатив на -о Мне интересно. Морфологически совпадает

Подробнее

КОНДАКОВ Валерий Константинович аспирант Московского Авиационного Института КОНСТРУИРОВАНИЕ КОНТРОЛЬНЫХ ЗАДАНИЙ ДЛЯ ЭЛЕКТРОННОГО УЧЕБНИКА

КОНДАКОВ Валерий Константинович аспирант Московского Авиационного Института КОНСТРУИРОВАНИЕ КОНТРОЛЬНЫХ ЗАДАНИЙ ДЛЯ ЭЛЕКТРОННОГО УЧЕБНИКА Информационные ресурсы образования КОНДАКОВ Валерий Константинович аспирант Московского Авиационного Института КОНСТРУИРОВАНИЕ КОНТРОЛЬНЫХ ЗАДАНИЙ ДЛЯ ЭЛЕКТРОННОГО УЧЕБНИКА Непременной составляющей процесса

Подробнее

Компьютерная лингвистика: от текста к знаниям. Вводная лекция о современной компьютерной лингвистике и её приложениях в реальной жизни

Компьютерная лингвистика: от текста к знаниям. Вводная лекция о современной компьютерной лингвистике и её приложениях в реальной жизни Компьютерная лингвистика: от текста к знаниям Вводная лекция о современной компьютерной лингвистике и её приложениях в реальной жизни Даниил Скатов, ООО «Диктум» г.н.новгород, ННГУ, 31 окт. 2011 Суть предмета

Подробнее

курса по выбору «Практикум по русскому языку»

курса по выбору «Практикум по русскому языку» Муниципальное автономное общеобразовательное учреждение г. Калининграда гимназия 32 РАБОЧАЯ ПРОГРАММА ПЕДАГОГА Мео Елены Павловны курса по выбору «Практикум по русскому языку» в 8 «Л» классе Количество

Подробнее

Результаты проверочной работы по русскому языку. Марина Ивановна Кузнецова

Результаты проверочной работы по русскому языку. Марина Ивановна Кузнецова Результаты проверочной работы по русскому языку Марина Ивановна Кузнецова Участники итоговых проверочных работ Количество Предметы Территорий Учащихся Русский язык 71 66790 Математика Комплексная работа

Подробнее

АНАЛИЗ РУССКОГО ТЕКСТА В СИСТЕМЕ КОМПЬЮТЕРНОГО СУРДОПЕРЕВОДА НА РУССКИЙ РАЗГОВОРНЫЙ ЖЕСТОВЫЙ ЯЗЫК*

АНАЛИЗ РУССКОГО ТЕКСТА В СИСТЕМЕ КОМПЬЮТЕРНОГО СУРДОПЕРЕВОДА НА РУССКИЙ РАЗГОВОРНЫЙ ЖЕСТОВЫЙ ЯЗЫК* СБОРНИК НАУЧНЫХ ТРУДОВ НГТУ. 2011. 1(63). 83 90 УДК 81'33:81: '32 АНАЛИЗ РУССКОГО ТЕКСТА В СИСТЕМЕ КОМПЬЮТЕРНОГО СУРДОПЕРЕВОДА НА РУССКИЙ РАЗГОВОРНЫЙ ЖЕСТОВЫЙ ЯЗЫК* М.Г. ГРИФ, Е.А. ДЕМЬЯНЕНКО Рассмотрена

Подробнее

Извлечение информации. Батыгин Владимир Computer Science Center

Извлечение информации. Батыгин Владимир Computer Science Center Извлечение информации Батыгин Владимир vbatygin@yandex-team.ru Computer Science Center План Что такое Information Extraction Источники данных Подходы Заключение 2 Задачи Named Entity Recognition Disambiguation

Подробнее

Правительство Российской Федерации

Правительство Российской Федерации Правительство Российской Федерации Федеральное государственное автономное образовательное учреждение высшего профессионального образования «Национальный исследовательский университет Высшая школа экономики»

Подробнее

О. Г. ХОМИЦЕВИЧ, С. В. РЫБИН, И. М. АНИЧКИН

О. Г. ХОМИЦЕВИЧ, С. В. РЫБИН, И. М. АНИЧКИН 42 УДК 519.688 О. Г. ХОМИЦЕВИЧ, С. В. РЫБИН, И. М. АНИЧКИН ИСПОЛЬЗОВАНИЕ ЛИНГВИСТИЧЕСКОГО АНАЛИЗА ДЛЯ НОРМАЛИЗАЦИИ ТЕКСТА И СНЯТИЯ ОМОНИМИИ В СИСТЕМЕ СИНТЕЗА РУССКОЙ РЕЧИ Исследована проблема разрешения

Подробнее

СТРУКТУРА СИСТЕМ СИНТЕЗА И РАСПОЗНАВАНИЯ РЕЧИ

СТРУКТУРА СИСТЕМ СИНТЕЗА И РАСПОЗНАВАНИЯ РЕЧИ Управление, вычислительная техника и информатика УДК 004.056:336.717 СТРУКТУРА СИСТЕМ СИНТЕЗА И РАСПОЗНАВАНИЯ РЕЧИ Р.В. Мещеряков Томский государственный университет систем управления и радиоэлектроники

Подробнее

РАБОЧАЯ ПРОГРАММА ДИСЦИПЛИНЫ

РАБОЧАЯ ПРОГРАММА ДИСЦИПЛИНЫ МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РФ государственное образовательное учреждение высшего профессионального образования «Мурманский государственный гуманитарный университет» (ГОУВПО МГГУ) РАБОЧАЯ ПРОГРАММА

Подробнее

РАБОЧАЯ ПРОГРАММА УЧЕБНОЙ ДИСЦИПЛИНЫ ДПП.Ф.01 ЯЗЫКОЗНАНИЕ

РАБОЧАЯ ПРОГРАММА УЧЕБНОЙ ДИСЦИПЛИНЫ ДПП.Ф.01 ЯЗЫКОЗНАНИЕ МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ «ТОМСКИЙ ГОСУДАРСТВЕННЫЙ ПЕДАГОГИЧЕСКИЙ УНИВЕРСИТЕТ»

Подробнее

Метапредметные результаты:

Метапредметные результаты: Рабочая программа по русскому языку 5 класс УМК под редакцией М.М. Разумовской I. Планируемые результаты освоения предметного курса. Личностные результаты: 1) понимание русского языка как одной из основных

Подробнее

Научный семинар. Часть 2. Text mining. Екатерина Черняк (дадии, Тьюторский центр) Дмитрий Ильвовский (дадии, НУЛ ИССА)

Научный семинар. Часть 2. Text mining. Екатерина Черняк (дадии, Тьюторский центр) Дмитрий Ильвовский (дадии, НУЛ ИССА) Научный семинар. Часть 2. Text mining Екатерина Черняк (дадии, Тьюторский центр) Дмитрий Ильвовский (дадии, НУЛ ИССА) Основные темы Стратегии сбора веб-корпусов Разрешение морфологической неоднозначности

Подробнее

ИНФОРМАЦИОННАЯ СТРУКТУРА НАУЧНОГО ТЕКСТА. ТЕКСТ В КОНТЕКСТЕ КОЛЛЕКЦИИ

ИНФОРМАЦИОННАЯ СТРУКТУРА НАУЧНОГО ТЕКСТА. ТЕКСТ В КОНТЕКСТЕ КОЛЛЕКЦИИ Л.М. Пивоварова, Е.В. Ягунова (СПбГУ) Информационная структура научного текста. Текст в контексте коллекции // Труды международной конференции «Корпусная лингвистика 2011». СПб.: С.-Петербургский гос.

Подробнее

Проблема разрешения «Ё»-омографов при синтезе речи по тексту The problem of the «Ё»-homographs resolution in text-to-speech synthesis

Проблема разрешения «Ё»-омографов при синтезе речи по тексту The problem of the «Ё»-homographs resolution in text-to-speech synthesis Проблема разрешения «Ё»-омографов при синтезе речи по тексту The problem of the «Ё»-homographs resolution in text-to-speech synthesis Лобанов Б. М. (lobanov@newman.bas-net.by), Объединенный институт проблем

Подробнее

Министерство образования и науки Республики Казахстан. Павлодарский государственный педагогический институт. Кафедра русского языка и литературы

Министерство образования и науки Республики Казахстан. Павлодарский государственный педагогический институт. Кафедра русского языка и литературы Министерство образования и науки Республики Казахстан Ф. 4-63 Павлодарский государственный педагогический институт Кафедра русского языка и литературы РАБОЧАЯ ПРОГРАММА дисциплины «Основы теории и истории

Подробнее

ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ

ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ Государственное образовательное учреждение высшего профессионального образования «Уральский государственный университет им. А.М. Горького» ИОНЦ «Русский язык» филологический

Подробнее

Как переводит компьютер. Соколова Светлана президент компании ПРОМТ, кандидат технических наук.

Как переводит компьютер. Соколова Светлана президент компании ПРОМТ, кандидат технических наук. Соколова Светлана президент компании ПРОМТ, кандидат технических наук. Как переводит компьютер Машинный перевод - это такая специфическая область применения компьютеров, в проблемах которой почти каждый

Подробнее

МАГИСТЕРСКАЯ ДИССЕРТАЦИЯ

МАГИСТЕРСКАЯ ДИССЕРТАЦИЯ Министерство образования и науки Российской Федерации Федеральное государственное автономное образовательное учреждение высшего образования «САНКТ-ПЕТЕРБУРГСКИЙ ПОЛИТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ ПЕТРА ВЕЛИКОГО»

Подробнее

Контекстное распознавание слитной речи

Контекстное распознавание слитной речи 7-ая Международная конференция «Управление развитием крупномасштабных систем» (MLSD 2013) Контекстное распознавание слитной речи Доклад подготовили: Институт проблем управления РАН МГТУ им. Н.Э. Баумана

Подробнее

МЕТОДЫ РЕШЕНИЯ ЛИНГВИСТИЧЕСКИХ ЗАДАЧ НА ОСНОВЕ ОНТОЛОГИЙ. Ольга Невзорова, Владимир Невзоров, Николай Пяткин

МЕТОДЫ РЕШЕНИЯ ЛИНГВИСТИЧЕСКИХ ЗАДАЧ НА ОСНОВЕ ОНТОЛОГИЙ. Ольга Невзорова, Владимир Невзоров, Николай Пяткин International Book Series "Information Science and Computing" 165 МЕТОДЫ РЕШЕНИЯ ЛИНГВИСТИЧЕСКИХ ЗАДАЧ НА ОСНОВЕ ОНТОЛОГИЙ Ольга Невзорова, Владимир Невзоров, Николай Пяткин Аннотация: Онтолингвистические

Подробнее

Планируемые результаты освоения учебного предмета

Планируемые результаты освоения учебного предмета Планируемые результаты освоения учебного предмета Предметными результатами изучения курса «Русский язык» является сформированность следующих умений: по фонетике и графике: производить фонетический разбор

Подробнее

Обязательный минимум содержания основных образовательных программ

Обязательный минимум содержания основных образовательных программ Обязательный минимум содержания основных образовательных программ Содержание, обеспечивающее формирование коммуникативной компетенции Речевое общение. Речь устная и письменная, монологическая и диалогическая.

Подробнее

АННОТАЦИЯ РАБОЧЕЙ ПРОГРАММЫ ПО РУССКОМУ ЯЗЫКУ 5-9 КЛАССЫ

АННОТАЦИЯ РАБОЧЕЙ ПРОГРАММЫ ПО РУССКОМУ ЯЗЫКУ 5-9 КЛАССЫ АННОТАЦИЯ РАБОЧЕЙ ПРОГРАММЫ ПО РУССКОМУ ЯЗЫКУ 5-9 КЛАССЫ Программа разработана в соответствии с требованиями Федерального закона от 29 декабря 2012 г. 273-ФЗ «Об образовании в Российской Федерации», Федерального

Подробнее

Аннотация к рабочей программе

Аннотация к рабочей программе Аннотация к рабочей программе Рабочая программа по русскому языку для 10-12 классов составлена на основе Федерального Компонента государственного стандарта среднего общего образования авторской Программы

Подробнее

Автоматическое формирование базы сочетаемости слов на основе очень большого корпуса текстов Клышинский Э. С. Кочеткова Н. А. Литвинов М. И.

Автоматическое формирование базы сочетаемости слов на основе очень большого корпуса текстов Клышинский Э. С. Кочеткова Н. А. Литвинов М. И. Автоматическое формирование базы сочетаемости слов на основе очень большого корпуса текстов Automatic construction of word combination database using a huge text corpus Клышинский Э. С. (klyshinsky@mail.ru),

Подробнее

Программа составлена на основании требований к основной образовательной программе послевузовского профессионального образования по отрасли

Программа составлена на основании требований к основной образовательной программе послевузовского профессионального образования по отрасли Программа составлена на основании требований к основной образовательной программе послевузовского профессионального образования по отрасли 10.00.00 Филологические науки (специальность 10.02.04 германские

Подробнее

3. научить рассматривать теорию второго иностранного языка в общем контексте теоретического

3. научить рассматривать теорию второго иностранного языка в общем контексте теоретического АННОТАЦИЯ УЧЕБНОЙ ДИСЦИПЛИНЫ Основы теории второго иностранного языка Направление подготовки 45.03.02 Лингвистика Профиль подготовки «Теория и практика межкультурной коммуникации» 1. Цели и задачи освоения

Подробнее

Синтез текстовой информации на английском языке при решении задач дистанционного обучения иностранному языку с использованием объектного подхода.

Синтез текстовой информации на английском языке при решении задач дистанционного обучения иностранному языку с использованием объектного подхода. Синтез текстовой информации на английском языке при решении задач дистанционного обучения иностранному языку с использованием объектного подхода. Н.В. Крапухина 1, С.Ю. Кулехин 2 В работе представлено

Подробнее

Научная специальность Германские языки Отрасль науки Филологические науки АННОТАЦИИ ДИСЦИПЛИН. Обязательные дисциплины

Научная специальность Германские языки Отрасль науки Филологические науки АННОТАЦИИ ДИСЦИПЛИН. Обязательные дисциплины Научная специальность 10.02.04 Германские языки Отрасль науки 10.00.00 Филологические науки АННОТАЦИИ ДИСЦИПЛИН Обязательные дисциплины ОД.А.01 История и философия науки Цель курса: формирование у аспирантов

Подробнее

АВТОМАТИЗИРОВАННАЯ СИСТЕМА НАУЧНЫХ ИССЛЕДОВАНИЙ ПСИХОЛИНГВИСТИЧЕСКИХ МОДЕЛЕЙ (АСНИ ПМ): РАБОЧАЯ ЭКСПЛУАТАЦИОННАЯ ВЕРСИЯ

АВТОМАТИЗИРОВАННАЯ СИСТЕМА НАУЧНЫХ ИССЛЕДОВАНИЙ ПСИХОЛИНГВИСТИЧЕСКИХ МОДЕЛЕЙ (АСНИ ПМ): РАБОЧАЯ ЭКСПЛУАТАЦИОННАЯ ВЕРСИЯ 1 А.В.Сиренко АВТОМАТИЗИРОВАННАЯ СИСТЕМА НАУЧНЫХ ИССЛЕДОВАНИЙ ПСИХОЛИНГВИСТИЧЕСКИХ МОДЕЛЕЙ (АСНИ ПМ): РАБОЧАЯ ЭКСПЛУАТАЦИОННАЯ ВЕРСИЯ 2012 г. 1 1. Описание системы 1.1. Назначение программного комплекса

Подробнее

Результаты диагностики знаний обучающихся по русскому языку, 9 класс Сентябрь 2014 Диагностика по русскому языку проводилась в сентябре 2014 года в

Результаты диагностики знаний обучающихся по русскому языку, 9 класс Сентябрь 2014 Диагностика по русскому языку проводилась в сентябре 2014 года в Результаты диагностики знаний обучающихся по русскому языку, 9 класс Сентябрь 2014 Диагностика по русскому языку проводилась в сентябре 2014 года в 9-х классах с целью определения уровня усвоения учащимися

Подробнее

ВВЕДЕНИЕ В ЯЗЫКОЗНАНИЕ. Языкознание как наука

ВВЕДЕНИЕ В ЯЗЫКОЗНАНИЕ. Языкознание как наука Семинар 1 Языкознание как наука 1. Наука о языке. 2. История языкознания как науки. 3. Разделы языкознания. 4. Интерцисциплинарный характер языкознания. 5. Методы языкознания. 6. Школы современного языкознания.

Подробнее

Рабочая программа по предмету «Русский язык» (7 класс)

Рабочая программа по предмету «Русский язык» (7 класс) Муниципальное автономное общеобразовательное учреждение «Школа 84» г. Нижнего Новгорода Утверждено приказом от 24.06.2016 272 Рабочая программа по предмету «Русский язык» (7 класс) Пояснительная записка

Подробнее

Реализация и исследование методов автоматической кластеризации текстовых документов с помощью методов машинного обучения

Реализация и исследование методов автоматической кластеризации текстовых документов с помощью методов машинного обучения УДК 004.93'1 Реализация и исследование методов автоматической кластеризации текстовых документов с помощью методов машинного обучения Лыфенко Н.Д., аспирант Россия, 125993, г. Москва, Российский государственный

Подробнее

«Подготовка к ГИА. Теория и практика»

«Подготовка к ГИА. Теория и практика» Муниципальное бюджетное общеобразовательное учреждение «Средняя общеобразовательная школа 7» УТВЕРЖДАЮ Директор МБОУ СОШ 7 Н.В.Киселева 28.08.2014г КАЛЕНДАРНО- ТЕМАТИЧЕСКОЕ ПЛАНИРОВАНИЕ курса по выбору

Подробнее

1.Цели и задачи дисциплины.

1.Цели и задачи дисциплины. 1.Цели и задачи дисциплины. 1.1. Цели преподавания дисциплины: Основными целями курса русского языка в колледже являются следующие: закрепить и углубить знания, развивать умения студентов по фонетике,

Подробнее

Спецификация контрольных измерительных материалов для проведения итоговой работы по РУССКОМУ ЯЗЫКУ (5 класс)

Спецификация контрольных измерительных материалов для проведения итоговой работы по РУССКОМУ ЯЗЫКУ (5 класс) 1 Спецификация контрольных измерительных материалов для проведения итоговой работы по РУССКОМУ ЯЗЫКУ (5 класс) 1. Назначение КИМ оценить уровень общеобразовательной подготовки по русскому языку учащихся

Подробнее

ПОЯСНИТЕЛЬНАЯ ЗАПИСКА

ПОЯСНИТЕЛЬНАЯ ЗАПИСКА ПОЯСНИТЕЛЬНАЯ ЗАПИСКА Элективный курс по русскому языку «Практикум по русскому языку. Подготовка к ОГЭ» предназначен для обучающихся 8 класса. Цель изучения курса формирование языковой и лингвистической

Подробнее

Рабочая программа кандидатского экзамена «Теория языка» [Текст] / сост. С.В. Лебедева; Курск. гос. ун-т. Курск, с.

Рабочая программа кандидатского экзамена «Теория языка» [Текст] / сост. С.В. Лебедева; Курск. гос. ун-т. Курск, с. Рецензенты: И.С. Климас, доктор филологических наук, профессор, профессор кафедры русского языка Курского государственного университета; И.С. Бороздина, доктор филологических наук, доцент, доцент кафедры

Подробнее

ГЛАВА 4. ПРИКЛАДНЫЕ ВОЗМОЖНОСТИ СИНТАКСИЧЕСКИХ ПРОЦЕССОРОВ В СИСТЕМАХ МАШИННОГО ПЕРЕВОДА И АВТОМАТИЧЕСКОЙ ОБРАБОТКИ ТЕКСТОВ

ГЛАВА 4. ПРИКЛАДНЫЕ ВОЗМОЖНОСТИ СИНТАКСИЧЕСКИХ ПРОЦЕССОРОВ В СИСТЕМАХ МАШИННОГО ПЕРЕВОДА И АВТОМАТИЧЕСКОЙ ОБРАБОТКИ ТЕКСТОВ И.М.НОЖОВ МОРФОЛОГИЧЕСКАЯ И СИНТАКСИЧЕСКАЯ ОБРАБОТКА ТЕКСТА (МОДЕЛИ И ПРОГРАММЫ) ГЛАВА 4. ПРИКЛАДНЫЕ ВОЗМОЖНОСТИ СИНТАКСИЧЕСКИХ ПРОЦЕССОРОВ В СИСТЕМАХ МАШИННОГО ПЕРЕВОДА И АВТОМАТИЧЕСКОЙ ОБРАБОТКИ ТЕКСТОВ

Подробнее

Т. В. Батура МАТЕМАТИЧЕСКАЯ ЛИНГВИСТИКА И АВТОМАТИЧЕСКАЯ ОБРАБОТКА ТЕКСТОВ НА ЕСТЕСТВЕННОМ ЯЗЫКЕ

Т. В. Батура МАТЕМАТИЧЕСКАЯ ЛИНГВИСТИКА И АВТОМАТИЧЕСКАЯ ОБРАБОТКА ТЕКСТОВ НА ЕСТЕСТВЕННОМ ЯЗЫКЕ МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ НОВОСИБИРСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ Факультет информационных технологий Кафедра систем информатики Т. В. Батура МАТЕМАТИЧЕСКАЯ ЛИНГВИСТИКА И

Подробнее

МОДЕЛИ, МЕТОДЫ И ПРОГРАММЫ АВТОМАТИЧЕСКОЙ ОБРАБОТКИ ФОРМ СЛОВ В ЕСТЕСТВЕННО-ЯЗЫКОВЫХ ИНТЕРФЕЙСАХ

МОДЕЛИ, МЕТОДЫ И ПРОГРАММЫ АВТОМАТИЧЕСКОЙ ОБРАБОТКИ ФОРМ СЛОВ В ЕСТЕСТВЕННО-ЯЗЫКОВЫХ ИНТЕРФЕЙСАХ ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ «РЯЗАНСКИЙ ГОСУДАРСТВЕННЫЙ РАДИОТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ» На правах рукописи ПРУЦКОВ Александр Викторович

Подробнее

ЛИНГВИСТИКА ТЕКСТА И МАШИННЫЙ ПЕРЕВОД

ЛИНГВИСТИКА ТЕКСТА И МАШИННЫЙ ПЕРЕВОД УДК 800:681.3 А.Т.АБДЫШОВА ЛИНГВИСТИКА ТЕКСТА И МАШИННЫЙ ПЕРЕВОД Бул макалада тексттерди автоматикалык турдо иштетуу формаларын машиналык котормону колдонуулуп концептуалдуу суроолор каралган.илимий техникалык

Подробнее

Материалы лекционного курса

Материалы лекционного курса Материалы лекционного курса I. Введение в прикладную линвистику (ПЛ) 1. Общие сведения о ПЛ. Задачи и методы, области приложения ПЛ. 2. Широкое и узкое понимание интересов ПЛ. Традиционные задачи, связанные

Подробнее

Русский язык Речь и речевое общение Выпускник научится: Выпускник получит возможность научиться:

Русский язык Речь и речевое общение Выпускник научится: Выпускник получит возможность научиться: Русский язык Речь и речевое общение использовать различные виды монолога (повествование, описание, рассуждение; сочетание разных видов монолога) в различных ситуациях общения; использовать различные виды

Подробнее

Русский язык Речь и речевое общение Выпускник научится: использовать различные виды монолога (повествование, описание, рассуждение;

Русский язык Речь и речевое общение Выпускник научится: использовать различные виды монолога (повествование, описание, рассуждение; 1.2.3.5. Русский язык Речь и речевое общение использовать различные виды монолога (повествование, описание, рассуждение; сочетание разных видов монолога) в различных ситуациях общения; использовать различные

Подробнее