ЛЕКЦИЯ 1. ВВЕДЕНИЕ В КОРПУСНУЮ ЛИНГВИСТИКУ

Save this PDF as:
 WORD  PNG  TXT  JPG

Размер: px
Начинать показ со страницы:

Download "ЛЕКЦИЯ 1. ВВЕДЕНИЕ В КОРПУСНУЮ ЛИНГВИСТИКУ"

Транскрипт

1 ЛЕКЦИЯ 1. ВВЕДЕНИЕ В КОРПУСНУЮ ЛИНГВИСТИКУ В.П. Захаров Санкт-Петербургский государственный университет

2 Лекция 1 Корпусная лингвистика 2 Понятие корпуса Лингвистический, или языковой, корпус текстов большой, представленный в электронном виде, унифицированный, структурированный, размеченный, филологически компетентный массив языковых данных, предназначенный для решения конкретных лингвистических задач.

3 Лекция 1 Корпусная лингвистика 3 Проанализируем Большой Электронный Унифицированный Структурированный Размеченный Филологически компетентный Предназначенный для

4 Лекция 1 Корпусная лингвистика 4 Словарные картотеки W.N. Francis. Language Corpora B.C. - In Directions in Corpus Linguistics: Proceedings of Nobel Symposium 82. Stockholm, 4-8 August 1991, ed. by Jan Svartvik. (Berlin & New York: Mouton de Gruyter, 1991)

5 Лекция 1 Корпусная лингвистика 5 Электронные библиотеки и их разнообразие Корпус латинских текстов Персей. Корпус текстов Ф. М. Достоевского. Электронная энциклопедия "Брокгауз и Ефрон". Фундаментальная электронная библиотека. Российская виртуальная библиотека. Библиотека М. Мошкова. Электронная библиотека Химического фак-та МГУ.. и т.д.

6 Лекция 1 Корпусная лингвистика 6 Корпус vs. электронная библиотека Тексты в корпусах рассматриваются прежде всего как образцы текстов. Тексты в электронных библиотеках, исходя из их назначения, правильнее всего называть произведениями со всеми характерными для них атрибутами. Лингвистический корпус текстов: образцы текстов лингвистическая разметка лингвостатистика репрезентативность языкового материала"условная" отбор языкового материала на основе критериев репрезентативности, лингвистической и историко-культурной значимости Электронная библиотека: полные тексты библиографические и историкокультурные элементы данных (если имеются) отсутствие статистики полнота текстов электронной библиотеки отбор текстов, определяемый выбором составителей библиотеки

7 Лекция 1 Корпусная лингвистика 7 Корпусная лингвистика Brown Corpus (1962). Корпусная лингвистика раздел компьютерной лингвистики, занимающийся разработкой общих принципов построения и использования лингвистических корпусов (корпусов текстов) с использованием компьютерных технологий.

8 Лекция 1 Корпусная лингвистика 8 Терминология (см. глоссарии Захаров, McEnery) Биграмма, N-грамма Выравнивание Коллокат Коллокация Коллигация Конкорданс Корпус Лемма Нормированная частота, ipm Парсер, парсинг Разметка, аннотация Токен, токенизация Тэг, тег, тэггер Частеречная разметка

9 Лекция 1 Корпусная лингвистика 9 Терминология (2) Alignment Annotation collocate collocation Concordance Corpus, corpora Corpus manager Disambiguation Lemmatization Parser, syntactic parser Parsing Part-of-speech tagging, POS tagger Query(ing) tools Tag, tagset Treebank

10 Лекция 1 Корпусная лингвистика 10 Корпус Собственно корпус (массив корпусных данных) + корпусный менеджер (специализированная поисковая система)

11 Лекция 1 Корпусная лингвистика 11 Лингвистические поисковые системы: корпусные менеджеры и конкордансеры поиск конкретных словоформ и вывод результатов в виде конкорданса; поиск словоформ по леммам; поиск группы словоформ в виде разрывной или неразрывной синтагмы; поиск словоформ по набору морфологических признаков; отображение информации о происхождении, типе текста и т.п.; вывод результатов поиска с указанием контекста заданной длины; получение различных лексико-грамматических статистических данных; сохранение отобранных строк конкорданса в отдельном файле на компьютере пользователя и др.

12 Лекция 1 Корпусная лингвистика 12 Конкорданс Конкорданс список контекстов, где искомая единица представлена в ее лексическом окружении и характеризуется набором статистических данных. В простейшем случае представляет собой алфавитный список слов в тексте с теми контекстами, в которых они встречались. Пример конкорданса (KWIC Key Word In Context) для слова poor : taste it is that such poor cattle always have in their mouths of sparing the poor child the inheritance of any part of small property of my poor father, whom I never saw--so long desolate, while your poor heart pined away, weep for it Miss, if the poor lady had suffered so intensely the love of my poor mother hid his torture from me

13 Лекция 1 Корпусная лингвистика 13 От конкордансеров к корпусным менеджерам Простой конкордансер может построить конкорданс отдельных слов, словосочетаний, частей слов, знаков пунктуации и т.д. в контекстном окружении. Но более сложные программы способны строить полные конкордансы, включающие в себя не только слова, но и другие элементы корпуса. Это лемма и морфологические характеристики слова; позиция слова в предложении и в структуре размеченного текста (HTML, XML); библиографические и типологические признаки документа, из которого выбран контекст (автор, название, источник, год издания, тип текста и т.д.); статистические данные и многое другое. Программы такого рода получили название corpus manager.

14 Лекция 1 Корпусная лингвистика 14 Корпусные менеджеры Корпусным менеджером (или корпусменеджером) (англ. corpus manager) называют специализированную поисковую систему управления текстовыми и лингвистическими данными, которая включает программные средства для поиска в корпусе, получения статистической информации и предоставления результатов пользователю в удобной форме. Bonito; CQP; DDC; WebCorp; Xaira...

15 Поиск в Интернет ПОИСКОВЫЕ СИСТЕМЫ СЕТИ ИНТЕРНЕТ КАК КОРПУСНЫЕ МЕНЕДЖЕРЫ. СПЕЦИАЛИЗИРОВАННЫЕ КОРПУСНЫЕ ИНТЕРФЕЙСЫ К ИНДЕКСАМ ГЛОБАЛЬНЫХ ПОИСКОВЫХ СИСТЕМ См. Лекция 1а.

16 Лекция 1 Корпусная лингвистика 16 Создание и использование корпусов Назначение языкового корпуса показать функционирование лингвистических единиц в их естественной контекстной среде. На основе корпуса можно получить данные: о частоте словоформ, лексем, грамматических категорий; об изменениях частот; об изменениях контекстов в различные периоды времени; о поведении языковых единиц разных авторов; о совместной встречаемости лексических единиц; об особенностях их сочетаемости, управления; и т.д.

17 Лекция 1 Корпусная лингвистика 17 Репрезентативность и сбалансированность Размеры и процентные соотношения: Жанры Стили Периоды Авторы Хронологические границы Объём: 1 млн. с/у 100 млн. 1 млрд. 100 млрд.??

18 Лекция 1 Корпусная лингвистика 18 Область ( domain ) в BNC imaginative (21.91%) arts (8.08%) belief and thought (3.40%) commerce/finance (7.93%) leisure (11.13) natural/pure science (4.18%) applied science (8.21%) social science (14.80%) world affairs (18.39%) unclassified (1.93%) Стоит ли разделить commerce/finance? Почему commerce/finance представлены в большей мере, чем arts? Стоит ли не выделить отдельную область для поэзии?

19 Лекция 1 Корпусная лингвистика 19 Источник ( medium ) в BNC book (55.58%) periodical (31.08%) misc. published (4.38%) misc. unpublished (4%) to-be-spoken (1.52%) unclassified (0.4%) Почему книг больше, чем периодики? Что многочисленнее? Почему маленький процент unpublished?.

20 Лекция 1 Корпусная лингвистика 20 Создание корпуса Проектирование Обеспечение поступления текстов в соответствии с перечнем источников Подготовка «технологического» описания Преобразование в машиночитаемую форму Конвертирование и предварительная обработка текстов Графематический анализ (токенизация) Метаразметка Лингвистическая разметка Корректировка результатов автоматической разметки Загрузка размеченных текстов в структуру корпусменеджера Обеспечение доступа к корпусу (поиск) Создание документационного обеспечения

21 Лекция 1 Корпусная лингвистика 21 Developing Linguistic Corpora: a Guide to Good Practice / Edited by Martin Wynne Preface Martin Wynne (AHDS Literature, Languages and Linguistics, University of Oxford, UK) Chapter 1 Corpus and Text: Basic Principles John Sinclair (Tuscan Word Centre) Chapter 2 Adding Linguistic Annotation Geoffrey Leech (Lancaster University) Chapter 3 Metadata for Corpus Work Lou Burnard (University of Oxford) Chapter 4 Character Encoding in Corpus Construction Anthony McEnery and Richard Xiao (Lancaster University) Chapter 5 Spoken Language Corpora Paul Thompson (University of Reading) Chapter 6 Archiving, Distribution and Preservation Martin Wynne (University of Oxford) Appendix to chapter one: How to make a corpus John Sinclair (Tuscan Word Centre) Bibliography

22 Лекция 1 Корпусная лингвистика 22 Разметка Англ.: tagging, annotation. Разметка приписывание текстам и их компонентам специальных меток. Виды разметки: экстралингвистическая (метаразметка) сведения об авторе и сведения о тексте: автор, название, год и место издания, жанр, тематика; структурная (глава, абзац, предложение, словоформа) собственно лингвистическая

23 Лекция 1 Корпусная лингвистика 23 Лингвистическая разметка 1. морфологическая разметка part-of-speech tagging (POS-tagging) 2. синтаксическая разметка 3. семантическая разметка 4. анафорическая разметка 5. просодическая разметка и т.д.

24 Лекция 1 Корпусная лингвистика 24 Типы корпусов Корпусы, относящиеся ко всему языку; корпусы, относящиеся к какому-либо подъязыку (жанр, стиль, язык определенной возрастной или социальной группы, язык писателя или ученого и т.п.). Существует большое число разных других типов корпусов. Можно выделить различные основания для классификации корпусов.

25 Лекция 1 Корпусная лингвистика 25 Пользователи Прикладные лингвисты; лексикографы; лингвисты-теоретики; преподаватели; компьютерные лингвисты; другие специалисты по языку (литературоведы, редакторы); специалисты по общественным наукам (историки, социологи); корпусы как инструмент для разработки и настройки различных автоматизированных систем (машинный перевод, распознавание речи, информационный поиск).

Программа учебной дисциплины Корпусные исследования в современной лингвистике

Программа учебной дисциплины Корпусные исследования в современной лингвистике Программа учебной дисциплины Корпусные исследования в современной лингвистике Для обучающихся по основной образовательной программе подготовки магистров 03700.68 Филология Количество зачетных единиц 3

Подробнее

ФОРУМ МОЛОДЫХ УЧЕНЫХ 4(4)

ФОРУМ МОЛОДЫХ УЧЕНЫХ 4(4) УДК 81-133 Лабачёва Маргарита Васильвна студентка 2 курса Армавирский Государственный Педагогический Университет Институт Русской и Иностранной Филологии Россия, г. Армавир Научные руководители: Гурова

Подробнее

ИНФОРМАЦИОННАЯ СТРУКТУРА НАУЧНОГО ТЕКСТА. ТЕКСТ В КОНТЕКСТЕ КОЛЛЕКЦИИ

ИНФОРМАЦИОННАЯ СТРУКТУРА НАУЧНОГО ТЕКСТА. ТЕКСТ В КОНТЕКСТЕ КОЛЛЕКЦИИ Л.М. Пивоварова, Е.В. Ягунова (СПбГУ) Информационная структура научного текста. Текст в контексте коллекции // Труды международной конференции «Корпусная лингвистика 2011». СПб.: С.-Петербургский гос.

Подробнее

КОРПУСНАЯ ЛИНГВИСТИКА И ПЕРЕВОД: ПОТЕНЦИАЛ И ОГРАНИЧЕНИЯ

КОРПУСНАЯ ЛИНГВИСТИКА И ПЕРЕВОД: ПОТЕНЦИАЛ И ОГРАНИЧЕНИЯ 86 КОРПУСНАЯ ЛИНГВИСТИКА И ПЕРЕВОД: ПОТЕНЦИАЛ И ОГРАНИЧЕНИЯ Л.Н. Беляева Одним из направлений использования электронных ресурсов вообще и корпусной лингвистике в частности является создание автоматизированных

Подробнее

ВЕБ-ПРОСТРАНСТВО КАК ЯЗЫКОВОЙ КОРПУС THE WORLD WIDE WEB AS LINGUISTIC CORPUS

ВЕБ-ПРОСТРАНСТВО КАК ЯЗЫКОВОЙ КОРПУС THE WORLD WIDE WEB AS LINGUISTIC CORPUS ВЕБ-ПРОСТРАНСТВО КАК ЯЗЫКОВОЙ КОРПУС THE WORLD WIDE WEB AS LINGUISTIC CORPUS В. П. Захаров vz1311@yandex.ru Кафедра математической лингвистики, Филологический факультет, Санкт-Петербургский государственный

Подробнее

Автоматическое извлечение правил для снятия морфологической неоднозначности

Автоматическое извлечение правил для снятия морфологической неоднозначности Автоматическое извлечение правил для снятия морфологической неоднозначности Екатерина Протопопова, Виктор Бочаров СПбГУ, Санкт-Петербург, Россия, protoev@gmail.com, victor.bocharov@gmail.com Аннотация.

Подробнее

Ключевые слова: Интернет, тувиноведение, обзор, тувинский язык, сайт, прикладная лингвистика

Ключевые слова: Интернет, тувиноведение, обзор, тувинский язык, сайт, прикладная лингвистика Тувиноведение в Интернете Электронный корпус текстов тувинского языка А. Я. Салчак Аннотация: Текст статьи был представлена на Международной научнопрактической конференции, посвященной 100-летию со дня

Подробнее

ИНТЕГРАЦИЯ МОРФОАНАЛИЗАТОРОВ ДЛЯ АННОТАЦИИ РУССКОЯЗЫЧНЫХ КОРПУСОВ ТЕКСТОВ

ИНТЕГРАЦИЯ МОРФОАНАЛИЗАТОРОВ ДЛЯ АННОТАЦИИ РУССКОЯЗЫЧНЫХ КОРПУСОВ ТЕКСТОВ П.В. Паничева, О.А. Митрофанова ИНТЕГРАЦИЯ МОРФОАНАЛИЗАТОРОВ ДЛЯ АННОТАЦИИ РУССКОЯЗЫЧНЫХ КОРПУСОВ ТЕКСТОВ Морфологическая аннотация русских корпусов и разрешение морфологической неоднозначности задачи,

Подробнее

КОРПуСНАЯ ЛИНГВИСТИКА

КОРПуСНАЯ ЛИНГВИСТИКА Министерство образования Республики Беларусь Учебно-методическое объединение по гуманитарному образованию Х.У ГВёРЖДАЮ, - }Іерізьій заместитель Министра образования Ьел ару с ь А. И. Жук Рсч йс'і^^анйонный

Подробнее

Магистрант: Бименова Жанат Батырбековна Научный руководитель: к.ф.-м.н. Сидорова Елена Анатольевна

Магистрант: Бименова Жанат Батырбековна Научный руководитель: к.ф.-м.н. Сидорова Елена Анатольевна Магистрант: Бименова Жанат Батырбековна Научный руководитель: к.ф.-м.н. Сидорова Елена Анатольевна Разработка методов и средств автоматизации построения тезаурусов предметных областей 1 Цели работы Разработка

Подробнее

Методы анализа текста и дискурса

Методы анализа текста и дискурса Методы анализа текста и дискурса Стефан Тичер, Майкл Мейер, Рут Водак, Ева Веттер Гуманитарный Центр Харьков 2009 УДК 80.81'42 ББК 81.2-5 Т 54 Перевод и научная редакция кандидата филологических наук Анны

Подробнее

КОРПУСНАЯ ЛИНГВИСТИКА

КОРПУСНАЯ ЛИНГВИСТИКА МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РФ ГОУ ВПО «Иркутский государственный лингвистический университет» В.П. Захаров, С.Ю. Богданова КОРПУСНАЯ ЛИНГВИСТИКА Учебник Иркутск ИГЛУ 2011 УДК 81 32 ББК 81.1-923 З

Подробнее

ВОЗМОЖНОСТИ ИСПОЛЬЗОВАНИЯ МЕТОДОВ КОРПУСНОЙ ЛИНГВИСТИКИ ПРИ ПЕРЕВОДЕ CORPUS LINGUISTICS AND CORPUS-BASED APPROACHES IN TRANSLATION

ВОЗМОЖНОСТИ ИСПОЛЬЗОВАНИЯ МЕТОДОВ КОРПУСНОЙ ЛИНГВИСТИКИ ПРИ ПЕРЕВОДЕ CORPUS LINGUISTICS AND CORPUS-BASED APPROACHES IN TRANSLATION УДК 81'33 Сырчина А.С., ассистент кафедры иностранных языков и межкультурной профессиональной коммуникации естественнонаучных направлений Тюменский государственный университет Россия, г. Тюмень ВОЗМОЖНОСТИ

Подробнее

Понятие коллокации в лингвистике

Понятие коллокации в лингвистике Анализ эфффективности статистических методов выявления коллокаций в текстах на русском языке 1 Study of effectiveness of statistical measures for collocation extraction on Russian texts Захаров В. П. (vz1311@yandex.ru),

Подробнее

Введение в обработку текстов. лекция 1

Введение в обработку текстов. лекция 1 Введение в обработку текстов лекция 1 О курсе Лектор: Турдаков Денис Юрьевич Лекции каждую пятницу в 18.00 ауд. П-6 Математический спецкурс для 3-5 курсов. предполагаются минимальные знания линейной алгебры,

Подробнее

Митрофанова О. А. Санкт-Петербургский государственный университет (СПбГУ)

Митрофанова О. А. Санкт-Петербургский государственный университет (СПбГУ) Автоматизированный анализ терминологии в русскоязычном корпусе текстов по корпусной лингвистике 1 Automatic analysis of terminology in the Russian text corpus on corpus linguistics Митрофанова О. А. (alkonost-om@yandex.ru)

Подробнее

À»Õ Œƒ»ƒ»» œœ Õ» À Œ œ Œ»ÕŒfl«Õ Œ. УДК 81:811.1/.2 Н. В. Козлова ЛИНГВИСТИЧЕСКИЕ КОРПУСА: ОПРЕДЕЛЕНИЕ ОСНОВНЫХ ПОНЯТИЙ И ТИПОЛОГИЯ

À»Õ Œƒ»ƒ»» œœ Õ» À Œ œ Œ»ÕŒfl«Õ Œ. УДК 81:811.1/.2 Н. В. Козлова ЛИНГВИСТИЧЕСКИЕ КОРПУСА: ОПРЕДЕЛЕНИЕ ОСНОВНЫХ ПОНЯТИЙ И ТИПОЛОГИЯ À»Õ Œƒ»ƒ»» œœ Õ» À Œ œ Œ»ÕŒfl«Õ Œ УДК 81:811.1/.2 Н. В. Козлова ÕÓ ÓÒË ËрÒÍËÈ ÓÒÛ рòú ÂÌÌ È ÛÌË ÂрÒËÚÂÚ ÛÎ. œëрó Ó, 2, ÕÓ ÓÒË ËрÒÍ, 630090, ÓÒÒˡ E-mail: talja@ngs.ru ЛИНГВИСТИЧЕСКИЕ КОРПУСА: ОПРЕДЕЛЕНИЕ

Подробнее

International Scientific Journal

International Scientific Journal Филологические науки УДК 81:39 (035.3) Гуляева Татьяна Петровна кандидат культурологии, доцент, доцент кафедры иностранных языков Пензенский государственный университет архитектуры и строительства Gulyaeva

Подробнее

Основные общелингвистические взгляды Дж. Р. Ферса

Основные общелингвистические взгляды Дж. Р. Ферса 24 Гаврилова Ю.В. Основные общелингвистические взгляды Дж. Р. Ферса Аннотация: Данная статья посвящена рассмотрению идей лингвистической теории выдающегося британского языковеда Дж. Р. Ферса, деятельность

Подробнее

М.-А.Н. Поландова Квантитативные и квалитативные методы исследования метафоры в компьютерном дискурсе

М.-А.Н. Поландова Квантитативные и квалитативные методы исследования метафоры в компьютерном дискурсе М.-А.Н. Поландова Квантитативные и квалитативные методы исследования метафоры в компьютерном дискурсе Исследование метафоры как лингвистического явления имеет богатую историю. Традиционно художественный

Подробнее

Правительство Российской Федерации. Факультет гуманитарных наук Школа лингвистики. Рабочая программа дисциплины «Научно-исследовательский семинар»

Правительство Российской Федерации. Факультет гуманитарных наук Школа лингвистики. Рабочая программа дисциплины «Научно-исследовательский семинар» Правительство Российской Федерации Федеральное государственное автономное образовательное учреждение высшего профессионального образования "Национальный исследовательский университет "Высшая школа экономики"

Подробнее

Корпусная лингвистка. проект Открытый Корпус и место компьютерной лингвистики в народном хозяйстве. Докладчик: Бочаров Виктор

Корпусная лингвистка. проект Открытый Корпус и место компьютерной лингвистики в народном хозяйстве. Докладчик: Бочаров Виктор Корпусная лингвистка проект Открытый Корпус и место компьютерной лингвистики в народном хозяйстве Докладчик: Бочаров Виктор июль 2011 О докладчике Виктор Бочаров: аспирант кафедры математической лингвистики

Подробнее

НАУЧНЫХ КОНФЕРЕНЦИЙ КАК СПЕЦИАЛЬНЫЙ КОРПУС ТЕКСТОВ

НАУЧНЫХ КОНФЕРЕНЦИЙ КАК СПЕЦИАЛЬНЫЙ КОРПУС ТЕКСТОВ О.Н. Камшилова МАТЕРИАЛЫ НАУЧНЫХ КОНФЕРЕНЦИЙ КАК СПЕЦИАЛЬНЫЙ КОРПУС ТЕКСТОВ Английский как lingua franca международного дискурса уже получил достаточно справедливую, хотя и не научную, оценку: body-snatched

Подробнее

Параллельные корпусы в лингвистических исследованиях

Параллельные корпусы в лингвистических исследованиях Параллельные корпусы в лингвистических исследованиях Занятие 2: Автоматическое выравнивание параллельных корпусов Андрей Кутузов akutuzov@hse.ru Высшая школа экономики Фундаментальная и прикладная лингвистика

Подробнее

Английский язык 6 класс Обобщенный план Косвенная речь (утвердительные предложения)

Английский язык 6 класс Обобщенный план Косвенная речь (утвердительные предложения) Английский язык 6 класс Обобщенный план 16.05.2015 Новые темы 1. Косвенная речь (вопросы) 2. Past Simple,, Темы на повторение 1. Косвенная речь (утвердительные предложения) 1. Косвенная речь. В вопросительных

Подробнее

Правительство Российской Федерации

Правительство Российской Федерации Правительство Российской Федерации Федеральное государственное автономное образовательное учреждение высшего профессионального образования «Национальный исследовательский университет Высшая школа экономики»

Подробнее

НАУЧНЫЙ СЕМИНАР «КОМПЬЮТЕРНАЯ ЛИНГВИСТИКА и TEXT MINING» Департамент анализа данных и искусственного интеллекта ФКН НИУ ВШЭ

НАУЧНЫЙ СЕМИНАР «КОМПЬЮТЕРНАЯ ЛИНГВИСТИКА и TEXT MINING» Департамент анализа данных и искусственного интеллекта ФКН НИУ ВШЭ НАУЧНЫЙ СЕМИНАР «КОМПЬЮТЕРНАЯ ЛИНГВИСТИКА и TEXT MINING» Департамент анализа данных и искусственного интеллекта ФКН НИУ ВШЭ НИС КЛиМТ : ПРЕПОДАВАТЕЛИ Большакова Елена Игоревна, к.ф-м.н, доцент Ефремова

Подробнее

Реализация и исследование методов автоматической кластеризации текстовых документов с помощью методов машинного обучения

Реализация и исследование методов автоматической кластеризации текстовых документов с помощью методов машинного обучения УДК 004.93'1 Реализация и исследование методов автоматической кластеризации текстовых документов с помощью методов машинного обучения Лыфенко Н.Д., аспирант Россия, 125993, г. Москва, Российский государственный

Подробнее

К.К. Боярский, В.П. Захаров, Е.А. Каневский

К.К. Боярский, В.П. Захаров, Е.А. Каневский К.К. Боярский, В.П. Захаров, Е.А. Каневский СНЯТИЕ НЕОДНОЗНАЧНОСТИ МОРФОЛОГИЧЕСКОЙ РАЗМЕТКИ КОРПУСОВ РУССКИХ ТЕКСТОВ 1 1. Характеристика положения в данной области Сравнительно недавно, во второй половине

Подробнее

Русский морфологический анализ и синтез с генерацией моделей словоизменения для не описанных в словаре слов. Илья Сегалович, Михаил Маслов e-mail: iseg@comptek.ru, maslov@comptek.ru Dictionary-based algorithm

Подробнее

Словарь и корпус текстов вепсского языка в виде компьютерной онлайн-системы (технический отчёт)

Словарь и корпус текстов вепсского языка в виде компьютерной онлайн-системы (технический отчёт) Словарь и корпус текстов вепсского языка в виде компьютерной онлайн-системы (технический отчёт) Veps dictionary and text corpus as an online computer system (technical report) А. А. Крижановский Andrew.Krizhanovsky

Подробнее

Лексический минимум как один из типов учебных словарей

Лексический минимум как один из типов учебных словарей Лексический минимум как один из типов учебных словарей Валентина В. Морозенко При внимательном рассмотрении учебных словарей, предназначенных для обеспечения курса «Иностранный язык» в вузах СССР, можно

Подробнее

Правительство Российской Федерации

Правительство Российской Федерации Правительство Российской Федерации Федеральное государственное автономное образовательное учреждение высшего профессионального образования Национальный исследовательский университет «Высшая школа экономики»

Подробнее

PROMT Translation Server 8.0 Intranet Edition

PROMT Translation Server 8.0 Intranet Edition PROMT Translation Server 8.0 Intranet Edition 1. Общее описание. Решение PROMT Translation Server 8.0 Intranet Edition (далее PTS) обеспечивает автоматизированный и эффективный перевод многоязычных информационных

Подробнее

Проблемы автоматической морфологии агглютинативных языков и парсер башкирского языка

Проблемы автоматической морфологии агглютинативных языков и парсер башкирского языка Проблемы автоматической морфологии агглютинативных языков и парсер башкирского языка Б. В. Орехов 1, Е. А. Слободян 2 1 Башкирский государственный педагогический университет им. М. Акмуллы, Уфа; Университет

Подробнее

СИСТЕМА АВТОМАТИЧЕСКОГО ПОРОЖДЕНИЯ АНГЛОЯЗЫЧНЫХ ДЕЛОВЫХ ЭЛЕКТРОННЫХ ПИСЕМ. Введение

СИСТЕМА АВТОМАТИЧЕСКОГО ПОРОЖДЕНИЯ АНГЛОЯЗЫЧНЫХ ДЕЛОВЫХ ЭЛЕКТРОННЫХ ПИСЕМ. Введение УДК 004.822:514 СИСТЕМА АВТОМАТИЧЕСКОГО ПОРОЖДЕНИЯ АНГЛОЯЗЫЧНЫХ ДЕЛОВЫХ ЭЛЕКТРОННЫХ ПИСЕМ Т.В. Бусел (tatsiana-busel@yandex.ru) Белорусский государственный лингвистический университет, г. Минск, Республика

Подробнее

ЛИНГВИСТИЧЕСКОЕ ПЕРЕВОДОВЕДЕНИЕ В АНГЛИИ:

ЛИНГВИСТИЧЕСКОЕ ПЕРЕВОДОВЕДЕНИЕ В АНГЛИИ: ЛИНГВИСТИЧЕСКОЕ ПЕРЕВОДОВЕДЕНИЕ В АНГЛИИ: ПЕРЕВОДЧЕСКАЯ КОНЦЕПЦИЯ ДЖ. КЭТФОРДА Гребнева Анастасия ФЛМ-1 2016 г. ДЖОН КЭТФОРД Джон Кэтфорд (26.03.1917 6.10.2009) шотландский лингвист и всемирно известный

Подробнее

Гибридная технология перевода. Юлия Епифанцева PROMT

Гибридная технология перевода. Юлия Епифанцева PROMT Гибридная технология перевода Юлия Епифанцева PROMT Машинный перевод Машинный (автоматический) перевод процесс перевода текстов с одного естественного языка на другой с помощью компьютерной программы Основные

Подробнее

ПРОБЛЕМЫ ПОСТРОЕНИЯ СИСТЕМ МАШИННОГО ПЕРЕВОДА

ПРОБЛЕМЫ ПОСТРОЕНИЯ СИСТЕМ МАШИННОГО ПЕРЕВОДА УДК 81:322.4 ПРОБЛЕМЫ ПОСТРОЕНИЯ СИСТЕМ МАШИННОГО ПЕРЕВОДА С.В. Фролов, Д.А. Паньков ГОУ ВПО «Тамбовский государственный технический университет»; ОАО «Тамбовская областная сбытовая компания», г. Тамбов

Подробнее

Автоматизация лингвистической разметки корпуса текстов

Автоматизация лингвистической разметки корпуса текстов Автоматизация лингвистической разметки корпуса текстов Бабина О.И. Южно-Уральский государственный университет Дюмин Н.Ю. Южно-Уральский государственный университет В современной лингвистике корпусные исследования

Подробнее

КОРПУС РУССКИХ СПОНТАННЫХ ТЕКСТОВ: СТРУКТУРА И ЕДИНИЦЫ CORPUS OF SPONTANEOUS RUSSIAN TEXTS: STRUCTURE AND ITEMS

КОРПУС РУССКИХ СПОНТАННЫХ ТЕКСТОВ: СТРУКТУРА И ЕДИНИЦЫ CORPUS OF SPONTANEOUS RUSSIAN TEXTS: STRUCTURE AND ITEMS А. В. Венцов, Ю. О. Нигматулина, О. В. Раева, Е. И. Риехакайнен, Н. А. Слепокурова A. V. Ventsov, Y. O. Nigmatulina, O. V. Raeva, E. I. Riekhakaynen, N. A. Slepokurova КОРПУС РУССКИХ СПОНТАННЫХ ТЕКСТОВ:

Подробнее

Выделение ключевых слов в русскоязычных текстах

Выделение ключевых слов в русскоязычных текстах УДК 004.3 Выделение ключевых слов в русскоязычных текстах Ершов Ю.С., бакалавр Россия, 105005, г. Москва, МГТУ им. Н.Э. Баумана, кафедра «Программное обеспечение ЭВМ и информационные технологии» Научный

Подробнее

Вероятностная модель токенизации в проекте Открытый корпус

Вероятностная модель токенизации в проекте Открытый корпус Вероятностная модель токенизации в проекте Открытый корпус В. В. Бочаров СПбГУ, OpenCorpora bocharov@opencorpora.org Д. В. Грановский СПбГУ, OpenCorpora grand@opencorpora.org А. В. Суриков OpenCorpora

Подробнее

А.А. Дунаев ИССЛЕДОВАТЕЛЬСКАЯ СИСТЕМА ДЛЯ АНАЛИЗА ТЕКСТОВ НА ЕСТЕСТВЕННОМ ЯЗЫКЕ

А.А. Дунаев ИССЛЕДОВАТЕЛЬСКАЯ СИСТЕМА ДЛЯ АНАЛИЗА ТЕКСТОВ НА ЕСТЕСТВЕННОМ ЯЗЫКЕ А.А. Дунаев ИССЛЕДОВАТЕЛЬСКАЯ СИСТЕМА ДЛЯ АНАЛИЗА ТЕКСТОВ НА ЕСТЕСТВЕННОМ ЯЗЫКЕ ВВЕДЕНИЕ Исследования в области автоматической обработки текста (АОТ) и формализации естественных языков, планомерно продвигаясь

Подробнее

А.Б. Борунов, В.Т. Малыгин

А.Б. Борунов, В.Т. Малыгин А.Б. Борунов, В.Т. Малыгин Международный гуманитарно-лингвистический институт, г. Москва Финансовый университет при Правительстве РФ, Владимирский филиал, г. Владимир ИССЛЕДОВАНИЕ АНГЛОЯЗЫЧНОГО АВТОРСКОГО

Подробнее

В.В. НЕКОТОРЫЕ АСПЕКТЫ ОБУЧЕНИЯ ЗРЕЛОМУ ЧТЕНИЮ НА ИНОСТРАННОМ ЯЗЫКЕ СТУДЕНТОВ И АСПИРАНТОВ ТЕХНИЧЕСКИХ ВУЗОВ

В.В. НЕКОТОРЫЕ АСПЕКТЫ ОБУЧЕНИЯ ЗРЕЛОМУ ЧТЕНИЮ НА ИНОСТРАННОМ ЯЗЫКЕ СТУДЕНТОВ И АСПИРАНТОВ ТЕХНИЧЕСКИХ ВУЗОВ Решетникова В.В. НЕКОТОРЫЕ АСПЕКТЫ ОБУЧЕНИЯ ЗРЕЛОМУ ЧТЕНИЮ НА ИНОСТРАННОМ ЯЗЫКЕ СТУДЕНТОВ И АСПИРАНТОВ ТЕХНИЧЕСКИХ ВУЗОВ Московский государственный университет путей сообщения МИИТ Эта работа посвящена

Подробнее

Критерии оценки для научных электронных ресурсов Evaluation Criteria for Electronic Resources

Критерии оценки для научных электронных ресурсов Evaluation Criteria for Electronic Resources Критерии оценки для научных электронных ресурсов Evaluation Criteria for Electronic Resources Козлова Е.И. Россия, НТЦ «Информрегистр» E. Kozlova Russia В течение длительного времени функции информационного

Подробнее

1.1. Указать начальный и конечный теги корневого элемента:

1.1. Указать начальный и конечный теги корневого элемента: Практическая работа 1 Тема: «Составление схем XML-документов» Цель работы: 1. Изучить теоретические основы использования языка разметки XML; 2. Получить практические навыки при составлении схем XML-документов

Подробнее

КОМПЬЮТЕРНАЯ ЛИНГВИСТИКА И ОБРАБОТКА ЕСТЕСТВЕННОГО ЯЗЫКА ПРОГРАММНЫЕ СРЕДСТВА ВЫЯВЛЕНИЯ СЕМАНТИЧЕСКОГО ПОЛЯ СЛОВ

КОМПЬЮТЕРНАЯ ЛИНГВИСТИКА И ОБРАБОТКА ЕСТЕСТВЕННОГО ЯЗЫКА ПРОГРАММНЫЕ СРЕДСТВА ВЫЯВЛЕНИЯ СЕМАНТИЧЕСКОГО ПОЛЯ СЛОВ КОМПЬЮТЕРНАЯ ЛИНГВИСТИКА И ОБРАБОТКА ЕСТЕСТВЕННОГО ЯЗЫКА УДК 001.103:002 ПРОГРАММНЫЕ СРЕДСТВА ВЫЯВЛЕНИЯ СЕМАНТИЧЕСКОГО ПОЛЯ СЛОВ И. Е. Воронина, А. А. Кретов, О. С. Титова Воронежский государственный университет

Подробнее

Ещѐ одним достоинством корпусной лингвистики является освобождение от «монополии» интуиции носителей языка. Использование аутентичного материала

Ещѐ одним достоинством корпусной лингвистики является освобождение от «монополии» интуиции носителей языка. Использование аутентичного материала Корпусная лингвистика в обучении английскому языку делового общения Толстова Татьяна Витальевна Поволжский филиал Международного университета в Москве, г. Самара, Россия Статья посвящена актуальному направлению

Подробнее

ТЕМА: «Пользователь офисных программ персонального компьютера. Курс для начинающих» Цель обучения: Контингент слушателей: Срок обучения:

ТЕМА: «Пользователь офисных программ персонального компьютера. Курс для начинающих» Цель обучения: Контингент слушателей: Срок обучения: ТЕМА: «Пользователь офисных программ персонального компьютера. Курс для начинающих» работы на современном ПК. Изучение принципов ведения рабочей документации и организация документооборота предприятия

Подробнее

Число наименований журналов: Из них российских журналов: Число журналов с полными текстами: Из них российских журналов: 567

Число наименований журналов: Из них российских журналов: Число журналов с полными текстами: Из них российских журналов: 567 1 Новый этап в развитии электронных научных изданий и библиотек И. Х. Галеев Казанский государственный технологический университет, Казань, Россия Следствием решения Президиума Высшей Аттестационной Комиссии

Подробнее

Восточноармянский национальный корпус

Восточноармянский национальный корпус Восточноармянский национальный корпус www.eanc.net Corpus Technologies Армянские корпуса и электронные библиотеки: Древнеармянский: www.digilib.am www.titus.uni-frankfurt.de (корпус) www.sd-editions.com/lalt/index.html

Подробнее

Анализ формальных понятий и сжатие текстовой информации в задаче автоматизированного контроля знаний. Емельянов Г.М., Михайлов Д.В.

Анализ формальных понятий и сжатие текстовой информации в задаче автоматизированного контроля знаний. Емельянов Г.М., Михайлов Д.В. Анализ формальных понятий и сжатие текстовой информации в задаче автоматизированного контроля знаний. Емельянов Г.М., Михайлов Д.В. Новгородский государственный университет имени Ярослава Мудрого Настоящая

Подробнее

Thumbs up? Sentiment Classification using Machine Learning Techniques

Thumbs up? Sentiment Classification using Machine Learning Techniques Thumbs up? Sentiment Classification using Machine Learning Techniques Авторы: Докладчик: Bo Pang & Lillian Lee Department of CS Cornell University Shivakumar Vaithyanathan IBM Almaden Research Center А.

Подробнее

О. Г. ХОМИЦЕВИЧ, С. В. РЫБИН, И. М. АНИЧКИН

О. Г. ХОМИЦЕВИЧ, С. В. РЫБИН, И. М. АНИЧКИН 42 УДК 519.688 О. Г. ХОМИЦЕВИЧ, С. В. РЫБИН, И. М. АНИЧКИН ИСПОЛЬЗОВАНИЕ ЛИНГВИСТИЧЕСКОГО АНАЛИЗА ДЛЯ НОРМАЛИЗАЦИИ ТЕКСТА И СНЯТИЯ ОМОНИМИИ В СИСТЕМЕ СИНТЕЗА РУССКОЙ РЕЧИ Исследована проблема разрешения

Подробнее

МЕТАДАННЫЕ ИНФОРМАЦИОННЫХ ОБРАЗОВАТЕЛЬНЫХ РЕСУРСОВ ДЛЯ ИНТЕРНЕТ-КАТАЛОГОВ. 1. Область применения

МЕТАДАННЫЕ ИНФОРМАЦИОННЫХ ОБРАЗОВАТЕЛЬНЫХ РЕСУРСОВ ДЛЯ ИНТЕРНЕТ-КАТАЛОГОВ. 1. Область применения МЕТАДАННЫЕ ИНФОРМАЦИОННЫХ ОБРАЗОВАТЕЛЬНЫХ РЕСУРСОВ ДЛЯ ИНТЕРНЕТ-КАТАЛОГОВ 6 1. Область применения Настоящий стандарт устанавливает общие требования к составу и виду рубрикаторов и метаописаний информационных

Подробнее

ПРИНЕСИ ТО, НЕ ЗНАЮ ЧТО: ПРЕДСТАВЛЕНИЕ И ПОИСК СИНТАКСИЧЕСКИХ НУЛЕВЫХ ЗНАКОВ И СМЕЖНЫХ ЯВЛЕНИЙ В АННОТИРОВАННОМ КОРПУСЕ 1

ПРИНЕСИ ТО, НЕ ЗНАЮ ЧТО: ПРЕДСТАВЛЕНИЕ И ПОИСК СИНТАКСИЧЕСКИХ НУЛЕВЫХ ЗНАКОВ И СМЕЖНЫХ ЯВЛЕНИЙ В АННОТИРОВАННОМ КОРПУСЕ 1 М.В. Копотев, Г.Б. Гурин ПРИНЕСИ ТО, НЕ ЗНАЮ ЧТО: ПРЕДСТАВЛЕНИЕ И ПОИСК СИНТАКСИЧЕСКИХ НУЛЕВЫХ ЗНАКОВ И СМЕЖНЫХ ЯВЛЕНИЙ В АННОТИРОВАННОМ КОРПУСЕ 1 1. Постановка задачи Практическая задача, с которой столкнулся

Подробнее

Л.Д. Бадмаева, Ж.Б. Бадагаров, Б.З. Цыдыпов

Л.Д. Бадмаева, Ж.Б. Бадагаров, Б.З. Цыдыпов Л.Д. Бадмаева, Ж.Б. Бадагаров, Б.З. Цыдыпов ОБЩИЕ ПРОБЛЕМЫ ФОРМИРОВАНИЯ КОРПУСА БУРЯТСКОГО ЯЗЫКА 1 При уже разработанных или интенсивно разрабатываемых лингвистических корпусах (http://www.natcorp.ox.ac.uk/,

Подробнее

Утверждено Декан факультета документных коммуникаций ФГБОУ ВО «ОГИК» Н.В. Акимова «23» мая 2016 г.

Утверждено Декан факультета документных коммуникаций ФГБОУ ВО «ОГИК» Н.В. Акимова «23» мая 2016 г. Утверждено Декан факультета документных коммуникаций ФГБОУ ВО «ОГИК» Н.В. Акимова «23» мая 2016 г. Аннотация к рабочей программе учебной дисциплины основной образовательной программы 46.03.02 Документоведение

Подробнее

готовностью принимать нравственные обязательства по отношению к окружающей природе, обществу и культурному наследию;

готовностью принимать нравственные обязательства по отношению к окружающей природе, обществу и культурному наследию; 1 ОК-5 способностью к осознанию значения гуманистических ценностей для сохранения и развития современной цивилизации; готовностью принимать нравственные обязательства по отношению к окружающей природе,

Подробнее

Гуманитарные исследования (42)

Гуманитарные исследования (42) пример, в либретто оперы Дж. Верди «Дон Карлос» (действие третье, картина пятая) читаем: «Мадрид. Кабинет короля. "Когда король спит, не спит враг". Считая себя преданным, Филипп пытается получить благословение

Подробнее

УДК :303.7 ИСПОЛЬЗОВАНИЕ СЛОВАРНОЙ ИНФОРМАЦИИ ПРИ АНАЛИЗЕ ТЕКСТА К.К. Боярский, Е.А. Каневский, С.К. Стафеев

УДК :303.7 ИСПОЛЬЗОВАНИЕ СЛОВАРНОЙ ИНФОРМАЦИИ ПРИ АНАЛИЗЕ ТЕКСТА К.К. Боярский, Е.А. Каневский, С.К. Стафеев К.К. Боярский, Е.А. Каневский, С.К. Стафеев УДК 004.912:303.7 ИСПОЛЬЗОВАНИЕ СЛОВАРНОЙ ИНФОРМАЦИИ ПРИ АНАЛИЗЕ ТЕКСТА К.К. Боярский, Е.А. Каневский, С.К. Стафеев Описаны подходы к решению некоторых проблем,

Подробнее

Извлечение информации о сочетаемости лексем из аннотированного корпуса текстов 1

Извлечение информации о сочетаемости лексем из аннотированного корпуса текстов 1 Извлечение информации о сочетаемости лексем из аннотированного корпуса текстов 1 Дяченко Павел, Фролова Татьяна Лаборатория компьютерной лингвистики ИППИ РАН pavelvd@cl.iitp.ru, tfrolova@cl.iitp.ru Аннотация

Подробнее

Урок английского языка. 2 класс

Урок английского языка. 2 класс Урок английского языка. 2 класс Дата: Тема: I and my family Тип урока: обобщающий урок Цели урока: формирование иноязычной коммуникативной компетенции по теме Семья ; совершенствование лексическо-грамматических

Подробнее

Аннотация по дисциплине «Медицинская информатика» 1. Трудоёмкость дисциплины. 2. Цели и задачи дисциплины. Цель. Задачи

Аннотация по дисциплине «Медицинская информатика» 1. Трудоёмкость дисциплины. 2. Цели и задачи дисциплины. Цель. Задачи Аннотация по дисциплине «Медицинская информатика» 1. Трудоёмкость дисциплины Тип занятия Часы 1 Лекции 20,00 2 Практические занятия 40,00 3 Самостоятельная работа 48,00 Общая трудоёмкость (в часах) 108,00

Подробнее

АННОТИРОВАННЫЕ ВОПРОСЫ ГОСУДАРСТВЕННОГО ЭКЗАМЕНА ПО ИНФОРМАТИКЕ С МЕТОДИКОЙ ПРЕПОДАВАНИЯ (Инф, ОЗО, 2014 г.)

АННОТИРОВАННЫЕ ВОПРОСЫ ГОСУДАРСТВЕННОГО ЭКЗАМЕНА ПО ИНФОРМАТИКЕ С МЕТОДИКОЙ ПРЕПОДАВАНИЯ (Инф, ОЗО, 2014 г.) АННОТИРОВАННЫЕ ВОПРОСЫ ГОСУДАРСТВЕННОГО ЭКЗАМЕНА ПО ИНФОРМАТИКЕ С МЕТОДИКОЙ ПРЕПОДАВАНИЯ (Инф, ОЗО, 2014 г.) 1. Понятие информации. Виды информации. Измерение информации. Различные уровни представления

Подробнее

ЭТАПЫ СОЗДАНИЯ СТАТИСТИЧЕСКОГО ПЕРЕВОДЧИКА ПОТОКОВ НОВОСТЕЙ

ЭТАПЫ СОЗДАНИЯ СТАТИСТИЧЕСКОГО ПЕРЕВОДЧИКА ПОТОКОВ НОВОСТЕЙ ЭТАПЫ СОЗДАНИЯ СТАТИСТИЧЕСКОГО ПЕРЕВОДЧИКА ПОТОКОВ НОВОСТЕЙ Ландэ Дмитрий Владимирович, д.т.н., профессор НТУУ «КПИ», зам. директора ElVisti Жигало Владлен Викторович, аспирант, инж.-программист ElVisti

Подробнее

ОД.01. ВВЕДЕНИЕ В ЯЗЫКОЗНАНИЕ

ОД.01. ВВЕДЕНИЕ В ЯЗЫКОЗНАНИЕ ОБЩИЕ ДИСЦИПЛИНЫ ОД.01. ВВЕДЕНИЕ В ЯЗЫКОЗНАНИЕ Место языка в системе культурно значимых средств коммуникации; способы научного описания языка; история общества и история языка, язык и мысль; язык и культура.

Подробнее

Министерство образования Российской Федерации. Санкт-Петербургский государственный электротехнический университет ЛЭТИ РАБОЧАЯ ПРОГРАММА

Министерство образования Российской Федерации. Санкт-Петербургский государственный электротехнический университет ЛЭТИ РАБОЧАЯ ПРОГРАММА Министерство образования Российской Федерации Санкт-Петербургский государственный электротехнический университет ЛЭТИ РАБОЧАЯ ПРОГРАММА дисциплины ПРИКЛАДНЫЕ ИНФОРМАЦИОННЫЕ И ПРОГРАММНЫЕ СРЕДСТВА Для подготовки

Подробнее

КОРПУС ВЕПССКОГО ЯЗЫКА 1 THE VEPS CORPUS

КОРПУС ВЕПССКОГО ЯЗЫКА 1 THE VEPS CORPUS Н.Г. Зайцева, М.М. Филатова, Н.Л. Шибанова, А.А. Крижановский N.G. Zaitseva, M.M. Filatova, N.L. Shibanova, A.A. Krizhanovsky КОРПУС ВЕПССКОГО ЯЗЫКА 1 THE VEPS CORPUS Аннотация. В работе описаны ключевые

Подробнее

Dependency Treebank for Russian: Current State of Affairs I.M. Boguslavskij, N.V. Grigoriev, S.A. Grigorieva, L.L. Iomdin, L.G. Kreidlin, N.E.

Dependency Treebank for Russian: Current State of Affairs I.M. Boguslavskij, N.V. Grigoriev, S.A. Grigorieva, L.L. Iomdin, L.G. Kreidlin, N.E. Разработка синтаксически размеченного корпуса русского языка И.М. Богуславский, Н.В. Григорьев, С.А. Григорьева, Л.Л. Иомдин, Л.Г. Крейдлин, Н.Е. Фрид 1 Институт проблем передачи информации РАН, 101447,

Подробнее

А.Ю. Антонова, Э.С. Клышинский, Е.В. Ягунова ОПРЕДЕЛЕНИЕ СТИЛЕВЫХ И ЖАНРОВЫХ ХАРАКТЕРИСТИК КОЛЛЕКЦИЙ ТЕКСТОВ НА ОСНОВЕ ЧАСТЕРЕЧНОЙ СОЧЕТАЕМОСТИ 1

А.Ю. Антонова, Э.С. Клышинский, Е.В. Ягунова ОПРЕДЕЛЕНИЕ СТИЛЕВЫХ И ЖАНРОВЫХ ХАРАКТЕРИСТИК КОЛЛЕКЦИЙ ТЕКСТОВ НА ОСНОВЕ ЧАСТЕРЕЧНОЙ СОЧЕТАЕМОСТИ 1 А.Ю. Антонова, Э.С. Клышинский, Е.В. Ягунова ОПРЕДЕЛЕНИЕ СТИЛЕВЫХ И ЖАНРОВЫХ ХАРАКТЕРИСТИК КОЛЛЕКЦИЙ ТЕКСТОВ НА ОСНОВЕ ЧАСТЕРЕЧНОЙ СОЧЕТАЕМОСТИ 1 1. Введение Тексты разных функциональных стилей отличаются

Подробнее

Обзор системы автоматизации перевода SDL Trados Studio 2009

Обзор системы автоматизации перевода SDL Trados Studio 2009 Обзор системы автоматизации перевода SDL Trados Studio 2009 Татьяна Виноградова Координатор проектов Т-Сервис www.tra-service.ru Tatiana.Vinogradova@tra-service.ru Содержание Технологии: Translation Memory

Подробнее

Разработка грамматики связи для синтаксического анализа казахского языка 1

Разработка грамматики связи для синтаксического анализа казахского языка 1 Вестник КазНУ, сер. мат., мех., инф. 2012, 2(73) 71 УДК 004.43 Жуманов Ж.М. Казахский Национальный университет им. аль-фараби, Алматы, Казахстан e-mail: z.zhake@gmail.com Разработка грамматики связи для

Подробнее

Технологии компании ПРОМТ

Технологии компании ПРОМТ Технологии и программные продукты компании ПРОМТ На сегодняшний день компания ПРОМТ обладает колоссальным технологическим багажом, что позволяет разрабатывать системы перевода с различными функциональными

Подробнее

ОСОБЕННОСТИ ИНТОНИРОВАНИЯ КОНТРАСТНЫХ ТЕМ В РУССКОМ, АНГЛИЙСКОМ И ФРАНЦУЗСКОМ ЯЗЫКАХ

ОСОБЕННОСТИ ИНТОНИРОВАНИЯ КОНТРАСТНЫХ ТЕМ В РУССКОМ, АНГЛИЙСКОМ И ФРАНЦУЗСКОМ ЯЗЫКАХ ЯЗЫКОЗНАНИЕ ОСОБЕННОСТИ ИНТОНИРОВАНИЯ КОНТРАСТНЫХ ТЕМ В РУССКОМ, АНГЛИЙСКОМ И ФРАНЦУЗСКОМ ЯЗЫКАХ Н. А. Фаустова Работа представлена кафедрой славянских языков и методики их преподавания Московского педагогического

Подробнее

О задаче определения стиля документов на естественном языке

О задаче определения стиля документов на естественном языке УДК 81'322.2 О задаче определения стиля документов на естественном языке Ланко А.А., студент, Россия, 105005, г. Москва, МГТУ им. Н.Э Баумана, кафедра «Программное обеспечение ЭВМ и компьютерные технологии»

Подробнее

Основы Web-технологий. Глоссарий Работу выполнил Захаров И. В. (МИФ ИНБ-11)

Основы Web-технологий. Глоссарий Работу выполнил Захаров И. В. (МИФ ИНБ-11) Основы Web-технологий Глоссарий Работу выполнил Захаров И. В. (МИФ ИНБ-11) Список терминов DNS (Domain Name System/Service)...3 HTML... 3 HTML-тэг... 3 HTTP... 3 IP-адрес... 3 JavaScript... 3 PHP... 3

Подробнее

Separate Representation of Word Combinations for Singular and Plural Number of Nouns (In Russian).

Separate Representation of Word Combinations for Singular and Plural Number of Nouns (In Russian). I.Bolshakov, A.Gelbukh Separate Representation of Word Combinations for Singular and Plural Number of Nouns (In Russian). // Proceedings of the International Conference on Applied Linguistics "Dialogue-96",

Подробнее

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ ТОМСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ ЯЗЫК И КУЛЬТУРА

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ ТОМСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ ЯЗЫК И КУЛЬТУРА МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ ТОМСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ ЯЗЫК И КУЛЬТУРА Сборник статей ХХIV Международной научной конференции, посвященной 135-летию Томского государственного

Подробнее

Mendeley оформление статьи, работа со списком литературы и не только...

Mendeley оформление статьи, работа со списком литературы и не только... Mendeley оформление статьи, работа со списком литературы и не только... 1 2 Три ключевых ценности Mendeley Увеличивает производительность Reference manager Делает возможным обмен знаниями Research Network

Подробнее

Модуль фрагментарного анализа в составе системы машинного перевода Crosslator 2.0

Модуль фрагментарного анализа в составе системы машинного перевода Crosslator 2.0 Модуль фрагментарного анализа в составе системы машинного перевода Crosslator 2.0 Жирнов Р. В. Институт Прикладной Математики им. М.В. Келдыша РАН Россия, 125047, Москва, Миусская пл., д.4 ultro@mail.ru

Подробнее

Аннотация к рабочей программе «Информатика и ИКТ» для классов базового уровня

Аннотация к рабочей программе «Информатика и ИКТ» для классов базового уровня Аннотация к рабочей программе «Информатика и ИКТ» для 10-11 классов базового уровня Рабочая программа по информатике и ИКТ для учащихся 11 А, Б, Д классов составлена в соответствии с нормативными документами:

Подробнее

Электронные словари и компьютерная лексикография

Электронные словари и компьютерная лексикография 1 Электронные словари и компьютерная лексикография Владимир Селегей Введение Термин "электронный словарь" стал уже привычным. При этом атрибут "электронный" характеризует свой объект настолько же поверхностно,

Подробнее

РАБОЧАЯ ПРОГРАММА ДИСЦИПЛИНЫ

РАБОЧАЯ ПРОГРАММА ДИСЦИПЛИНЫ МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования «Московский государственный лингвистический

Подробнее

Анализ сетевой нагрузки в распределенной системе организационного управления

Анализ сетевой нагрузки в распределенной системе организационного управления Анализ сетевой нагрузки в распределенной системе организационного управления Д.В. Волчков ИППИ РАН vol@tp.ru В.А. Шарануца ИППИ РАН knshk@mal.ru Аннотация В данной работе предлагается модель оценки сетевой

Подробнее

4. Время подготовки не более 60 минут, на ответ 30 минут. Использование справочной, учебно-методической, учебной литературы не допускается.

4. Время подготовки не более 60 минут, на ответ 30 минут. Использование справочной, учебно-методической, учебной литературы не допускается. ПОЛОЖЕНИЕ об итоговом междисциплинарном экзамене «Прикладная лингвистика» Специальность 031301 «Теоретическая и прикладная лингвистика» Квалификация специалиста «Лингвист» (ГОС ВПО от 14 марта 2000) 1.

Подробнее

ЛЕКСИКОГРАФИЧЕСКИЙ ПОРТРЕТ СЛОВА В ЭЛЕКТРОННЫХ СЛОВАРЯХ

ЛЕКСИКОГРАФИЧЕСКИЙ ПОРТРЕТ СЛОВА В ЭЛЕКТРОННЫХ СЛОВАРЯХ УДК 811.161.1'374 И. И. Заваруева Днепропетровский национальный технический университет железнодорожного транспорта имени В. Лазаряна ЛЕКСИКОГРАФИЧЕСКИЙ ПОРТРЕТ СЛОВА В ЭЛЕКТРОННЫХ СЛОВАРЯХ Проаналізовано

Подробнее

Если Вы хотите освоить английский язык, песни - это великолепный источник грамматических

Если Вы хотите освоить английский язык, песни - это великолепный источник грамматических Если Вы хотите освоить английский язык, песни - это великолепный источник грамматических структур и английских слов. Для изучения Past Simple/ Indefinite: Regular and irregular verbs (Прошедшее простое

Подробнее

РАБОЧАЯ ПРОГРАММА ДИСЦИПЛИНЫ

РАБОЧАЯ ПРОГРАММА ДИСЦИПЛИНЫ МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РФ государственное образовательное учреждение высшего профессионального образования «Мурманский государственный гуманитарный университет» (ГОУВПО МГГУ) РАБОЧАЯ ПРОГРАММА

Подробнее

АННОТАЦИЯ РАБОЧЕЙ ПРОГРАММЫ ДИСЦИПЛИНЫ

АННОТАЦИЯ РАБОЧЕЙ ПРОГРАММЫ ДИСЦИПЛИНЫ МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования «Московский государственный лингвистический

Подробнее

Титульный лист отчета о работе в 2012 г. по Программе фундаментальных исследований Президиума РАН «Корпусная лингвистика»

Титульный лист отчета о работе в 2012 г. по Программе фундаментальных исследований Президиума РАН «Корпусная лингвистика» Титульный лист отчета о работе в 2012 г. по Программе фундаментальных исследований Президиума РАН «Корпусная лингвистика» Номер и название направления Программы Направление III Создание и развитие корпусных

Подробнее

272 Секция 5. Web-технологии и компьютерный дизайн

272 Секция 5. Web-технологии и компьютерный дизайн 272 Секция 5. Web-технологии и компьютерный дизайн УДК 004.7 В.В. Калошко, Н.Е. Губенко Донецкий национальный технический университет, г. Донецк кафедра компьютерных систем мониторинга РАЗРАБОТКА ВИЗУАЛЬНОГО

Подробнее

КОРПУСНАЯ ЛИНГВИСТИКА И ЕЕ ИСПОЛЬЗОВАНИЕ В КОМПЬЮТЕРИЗИРОВАННОМ ЯЗЫКОВОМ ОБУЧЕНИИ. О.В. Нагель

КОРПУСНАЯ ЛИНГВИСТИКА И ЕЕ ИСПОЛЬЗОВАНИЕ В КОМПЬЮТЕРИЗИРОВАННОМ ЯЗЫКОВОМ ОБУЧЕНИИ. О.В. Нагель УДК 811.111 КОРПУСНАЯ ЛИНГВИСТИКА И ЕЕ ИСПОЛЬЗОВАНИЕ В КОМПЬЮТЕРИЗИРОВАННОМ ЯЗЫКОВОМ ОБУЧЕНИИ О.В. Нагель Аннотация. Рассматривается использование методов прикладной лингвистики в преподавании иностранного

Подробнее

3.1.4 Модуль статистического анализа Хранение данных Формат хранения данных Механизм хранения данных

3.1.4 Модуль статистического анализа Хранение данных Формат хранения данных Механизм хранения данных 2 Содержание Введение... 5 1 Задачи статистического анализа ЕЯ текстов... 7 1.1 Метрика TF-IDF и ее модификации... 7 1.2 Статистические подходы на основе мешка слов... 10 1.3 Кластерный анализ... 12 1.4

Подробнее

АНАЛИЗ ТОНАЛЬНОСТИ ТЕКСТА

АНАЛИЗ ТОНАЛЬНОСТИ ТЕКСТА САНКТ- ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ МАТЕМАТИКО- МЕХАНИЧЕСКИЙ ФАКУЛЬТЕТ КАФЕДРА СИСТЕМНОГО ПРОГРАММИРОВАНИЯ АНАЛИЗ ТОНАЛЬНОСТИ ТЕКСТА КУРСОВАЯ РАБОТА СТУДЕНТА 361 ГРУППЫ КАЛМЫКОВА АЛЕКСЕЯ ВЛАДИМИРОВИЧА

Подробнее

ЧАСТОТНО-ОСНОВАННЫЙ ПОДХОД К ЯЗЫКОВОЙ ДИНАМИКЕ 1 FREQUENCY-BASED APPROACH FOR LANGUAGE DYNAMICS

ЧАСТОТНО-ОСНОВАННЫЙ ПОДХОД К ЯЗЫКОВОЙ ДИНАМИКЕ 1 FREQUENCY-BASED APPROACH FOR LANGUAGE DYNAMICS ЧАСТОТНО-ОСНОВАННЫЙ ПОДХОД К ЯЗЫКОВОЙ ДИНАМИКЕ 1 FREQUENCY-BASED APPROACH FOR LANGUAGE DYNAMICS В. Д. Соловьев V. D. Solovyev Аннотация. В статье дается обзор проведенных в КФУ в 2011 2012 гг. исследований

Подробнее

MODERN TECHNOLOGIES 11 КЛАСС

MODERN TECHNOLOGIES 11 КЛАСС MODERN TECHNOLOGIES 11 КЛАСС ТЕХНОЛОГИЧЕСКАЯ КАРТА УРОКА Наименование предмета: Английский язык Класс: 11 класс Используемые учебники и учебные пособия: Биболетова М.З., Бабушис Е.Е., Снежко Н.Д. Английский

Подробнее

РАЗРАБОТКА ПАРСЕРА РАСПИСАНИЯ ЖЕЛЕЗНОДОРОЖНЫХ ПОЕЗДОВ DESIGN OF SURBURBAN TRAINS SCHEDULE PARSER

РАЗРАБОТКА ПАРСЕРА РАСПИСАНИЯ ЖЕЛЕЗНОДОРОЖНЫХ ПОЕЗДОВ DESIGN OF SURBURBAN TRAINS SCHEDULE PARSER УДК 004.414.28 Кожуханцева Ирина Валентиновна студент группы ИС-06 Научный руководитель: Стучилин Владимир Валерьевич доц., к.т.н. Московский государственный горный университет РАЗРАБОТКА ПАРСЕРА РАСПИСАНИЯ

Подробнее