ФОРМАЛЬНОЕ ОПРЕДЕЛЕНИЕ ТЕМЫ И ОСНОВНОГО СОДЕРЖАНИЯ ТЕКСТА КАК ОСНОВА ПРОЦЕДУРЫ АВТОМАТИЧЕСКОГО ОБЪЕДИНЕНИЯ НОВОСТНЫХ СООБЩЕНИЙ В ЕДИНЫЙ СЮЖЕТ

Save this PDF as:
 WORD  PNG  TXT  JPG

Размер: px
Начинать показ со страницы:

Download "ФОРМАЛЬНОЕ ОПРЕДЕЛЕНИЕ ТЕМЫ И ОСНОВНОГО СОДЕРЖАНИЯ ТЕКСТА КАК ОСНОВА ПРОЦЕДУРЫ АВТОМАТИЧЕСКОГО ОБЪЕДИНЕНИЯ НОВОСТНЫХ СООБЩЕНИЙ В ЕДИНЫЙ СЮЖЕТ"

Транскрипт

1 А.О. Третьяк (Минск, МГЛУ) ФОРМАЛЬНОЕ ОПРЕДЕЛЕНИЕ ТЕМЫ И ОСНОВНОГО СОДЕРЖАНИЯ ТЕКСТА КАК ОСНОВА ПРОЦЕДУРЫ АВТОМАТИЧЕСКОГО ОБЪЕДИНЕНИЯ НОВОСТНЫХ СООБЩЕНИЙ В ЕДИНЫЙ СЮЖЕТ В современном мире происходит большое количество разных событий, поэтому выбор новостных сюжетов для освещения и определение порядка их появления в новостных выпусках является важной задачей, которую иногда сложно реализовать быстро вручную. Вследствие этого, создание автоматизированной системы обработки новостей является актуальной проблемой, поскольку позволяет формализовать и ускорить процесс их обработки. Под новостным сюжетом будем понимать совокупность сведений о некоторых сущностях и явлениях, т.е. сделаем допущение, что группа схожих по содержанию и близких по времени новостных сообщений соответствует новостному сюжету. Таким образом, выделение новостных сюжетов сводится к разбиению информационного потока на тематические группы. Автоматическое определение темы текста (отнесение текста к определенной тематической области) проводится в рамках автоматического индексирования. Среди методов автоматического индексирования наибольший интерес для данной работы представляет дескрипторный (индикаторный) метод. При индексировании текста по этому методу предварительно изучается большое количество текстов разной тематической направленности. По текстам каждой тематики создаётся словарь дескрипторов (индикаторов), т.е. слов, специфичных для данной темы. Все слова-дескрипторы при этом делятся на безусловные и условные индикаторы. К безусловным дескрипторам относятся те лексические единицы, которые однозначно определяют принадлежность текста к данной тематике. Условные дескрипторы могут употребляться в текстах различных тематик. Среди них выделяют квазиоднозначные и тематически многозначные дескрипторы. Квазиоднозначными являются те лексические единицы, употребление которых более вероятно в текстах, относящихся к одной тематике, но они встречаются и в текстах других тематик. Тематически многозначные дескрипторы это такие лексические единицы, частота употребления которых в текстах разных тематик приблизительно одинакова. Процесс индексирования текста на основе данного метода осуществляется следующим образом. Первоначально в ходе его семантического анализа определяется наличие безусловных индикаторов. Если в тексте содержатся только безусловные дескрипторы одной тематической области, то текст относится к одной тематике. В противном

2 случае текст политематичен и относится к разным предметным областям. Если в тексте найдены безусловные дескрипторы только одной предметной области и условные дескрипторы различных предметных областей, то тематическая направленность текста определяется в два этапа. На первом этапе с опорой на безусловные дескрипторы делается предварительный вывод о том, что текст относится к конкретной тематической области. Следующий этап связан с анализом условных дескрипторов. Компьютер определяет расстояние между условными дескрипторами, их сочетаемость и делает окончательный вывод о том, однотематичен или политематичен текст. Для того чтобы слово можно было использовать в качестве дескриптора, следует определить, насколько оно значимо для данной предметной области и не относится ли оно к общеупотребительной лексике. Г.П. Лун [1, c. 124] предложил способ измерения значимости слов путем использования частот их появления в тексте. Сначала он обратил внимание на то, что наиболее часто встречающиеся слова являются «слишком общими, чтобы иметь требуемый тип значимости...» и что они могут быть исключены из рассмотрения благодаря использованию списка общих слов или же «путем отбрасывания наиболее часто встречающихся слов при использовании статистических методов... Точно так же можно было бы отбрасывать редко встречающиеся слова. Это кажется интуитивно разумным, так как если в большой статье или книге слово встречается всего один или два раза, то такому слову едва ли придается большая значимость» [1, c. 125]. Однако Г.П. Лун не определил, что такое «значимость». В статистике при проверке какойлибо гипотезы значимость определяется некоторым числом, выражающим отличие от ожидавшейся величины. Таким образом, значимым является то, что отклоняется от ожидаемого [1, c ]. Следовательно, значимым (информативным) словом будет являться слово, частота повторения которого в некоторых документах выше, чем при случайном распределении. Американскими исследователями было установлено пороговое значение частоты употребления слов в текстах, при котором слово становится значимым. Оно вычисляется по следующей формуле [2, c. 156]: Q=(10500*ЕК)/F, где Q коэффициент значимости слова; F абсолютная частота употребления слова на 1 млн. словоупотреблений; ЕК обратная величина коэффициента изменения частоты употребления этого слова. ЕК вычисляется следующим образом:

3 где N количество документов в выборке; L d количество слов во взятом подряд тексте; f c,d количество случаев появления слова с в документе d; g c,d / L d нормализованная частота появления слова с в документе d. При Q > Q=(10500*ЕК)/F слово будет значимым. При автоматическом определении основного содержания текста центральной является проблема критериев, используемых для выбора наиболее информативных слов и предложений из первичного документа. Чаще всего для этих целей используются статистические, позиционные и лингвосемантические методы [3]. Исходя из цели данного исследования, рассмотрим более подробно статистические методы. Они основаны на использовании статистических параметров для оценки информативности различных элементов текста и учитывают, прежде всего, показатель частоты встречаемости слов в тексте. В результате ранжирования лексики в том или ином документе определяют слова с высоким рангом и их сочетаемость в различных фразах [4, c. 144]. Статистическая информация об отдельных лексических единицах легко извлекается компьютером из текста, и есть все основания полагать, что она адекватно отражает его основное содержание. Свое начало статистические методы берут из работ вышеупомянутого американского ученого Г.П. Луна, который в 1958 году получил первый в мире машинный реферат текста. Он был основан на допущении, что чем больше часто встречающихся знаменательных слов оказывается рядом, тем более существенную информацию содержит предложение. Разработанный Г.П. Луном алгоритм автоматического составления реферата включал в себя следующие действия: ЭВМ «читала» исходный текст и создавала по нему частотный словарь всех словоформ. Далее из этого словаря удалялась вся служебная и общеупотребительная лексика. По специальной формуле в зависимости от длины текста рассчитывалась критическая (пороговая) частота употребления словоформы в тексте. Частоты словоформ словаря сравнивались с этим пороговым значением, и в случае его превышения данные словоформы сохранялись в словаре. Низкочастотная лексика из словаря удалялась. Затем ЭВМ «читала» текст еще раз по отдельным предложениям. Каждое из них анализировалось на наличие в нем ключевых слов. Если в предложении не было ключевых слов, то оно в реферат не включалось. Если в предложении было два и более ключевых слова, то ЭВМ

4 анализировала расстояние между ними. Если расстояние между ключевыми словами было невелико (2 4 слова), то предложение считалось информационно значимым и включалось в создаваемый ЭВМ реферат текста. В противном случае оно пропускалось. В настоящее время существует целая группа статистических методов. Так, в одном из них [5, c. 125] процедура выделения ключевых слов текста сводится к следующему: 1. Компьютер разбивает текст на абзацы и составляет по каждому абзацу алфавитно-частотный словарь словоформ. 2. Далее все алфавитно-частотные словари абзацев объединяются в единый распределительный алфавитно-частотный словарь словоформ всего текста. В нем указывается общая частота употребления словоформы в тексте и числа абзацев, в которых она встретилась. 3. Затем производится сокращение распределительного алфавитночастотного словаря словоформ текста до словаря потенциальных ключевых (опорных) слов. Эта процедура включает в себя следующие операции. Из распределительного словаря удаляется вся служебная и общеупотребительная лексика. В оставшейся части словаря суммируются частоты всех грамматических форм одного и того же слова. Далее в этом же словаре суммируются частоты синонимов (в том числе и контекстуальных). Затем из оставшейся части распределительного словаря удаляются слова, которые встретились только в одном абзаце. 4. На последнем этапе словарь потенциальных опорных слов текста делится на две части. В первую часть входят главные опорные слова (ГОС), а во вторую второстепенные опорные слова (ВОС). Данная процедура осуществляется на основе коэффициента важности каждого слова, который вычисляется по формуле: К в =F*m/N*n, где F абсолютная частота употребления слова с учётом всех грамматических форм и синонимов; m количество абзацев, в которых встретилось слово; N общее число словоупотреблений в тексте; n общее число абзацев в тексте. Предварительно, в зависимости от длины текста (в словах и абзацах) по специальной формуле определяется средняя (пороговая) величина коэффициента важности [6, c. 45]. Коэффициент важности каждого слова словаря сравнивается с этой величиной. Если коэффициент важности слова выше пороговой величины, то оно относится к числу главных опорных слов, если меньше пороговой величины к числу второстепенных опорных слов текста. Слова, входящие в каждую из выделенных групп, не однородны по своему содержанию. Они обозначают основные компоненты описанной в тексте ситуации: адресата и адресанта (субъекты), совершаемые ими действия в определенное время и в определенном месте, а также объекты действительности, о которых идет речь в тексте.

5 Для адекватного формализованного представления основного содержания текста необходимо оперировать не отдельными словами, а определенным набором ключевых слов, который и представляет собой «информационный портрет» текста новостного сообщения. Максимальная смысловая близость «информационных портретов» текстов, а также их монотематичность являются двумя важными факторами, которые необходимо учитывать компьютеру при объединении текстов в единый сюжет. ЛИТЕРАТУРА 1. Мидоу, Ч. Анализ информационно-поисковых систем. Введение для программистов. М., Деннис, Ф. Разработка и испытание полностью автоматизированной системы индексирования и поиска текстовых документов // Информационный поиск: cб. матер. / Под ред. К.Н. Трофимова М., С Горяник, Л.В., Дорохина, Г.В. Тематический фильтр текстов // Искусственный интеллект. Донецк, С Блюменау, Д.И. Информационный анализ/синтез для формирования вторичных документов: учебно-практ. пособие. СПб., Зубов, А.В, Зубова, И.И. Компьютерная лингвистика // Основы лингвистической информатики. В 3-х частях Минск, Ч Зубов, А.В. Вероятностно-алгоритмическая модель порождения текста // Проблемы порождения текста. В 4-х частях. Минск, Ч. 2.

Выводы Науч. рук. к.т.н., доц. Звенигородский А.С. Определение биграмм на материале научных текстов по извлечению данных из текстов

Выводы Науч. рук. к.т.н., доц. Звенигородский А.С. Определение биграмм на материале научных текстов по извлечению данных из текстов Рис. 3. Пример сдвига на две позиции Выводы Рассмотренные методы позволяют совершенствовать технологию формирования растровых стереоизображений, а разработанный плагин дает возможность ускорения этого

Подробнее

К ВОПРОСУ РАЗРАБОТКИ СЛОВАРЕЙ ИНФОРМАЦИОННОЙ СИСТЕМЫ «МАШИННЫЙ ФОНД БЕЛОРУССКОГО ЯЗЫКА»

К ВОПРОСУ РАЗРАБОТКИ СЛОВАРЕЙ ИНФОРМАЦИОННОЙ СИСТЕМЫ «МАШИННЫЙ ФОНД БЕЛОРУССКОГО ЯЗЫКА» Н.К. Рубашко, Г.П. Невмержицкая (Минск, БГУ) К ВОПРОСУ РАЗРАБОТКИ СЛОВАРЕЙ ИНФОРМАЦИОННОЙ СИСТЕМЫ «МАШИННЫЙ ФОНД БЕЛОРУССКОГО ЯЗЫКА» В научно-исследовательской лаборатории интеллектуальных информационных

Подробнее

НЕОБХОДИМОСТЬ ВЫДЕЛЕНИЯ КЛЮЧЕВЫХ СЛОВ ДЛЯ СВЁРТЫВАНИЯ ТЕКСТА

НЕОБХОДИМОСТЬ ВЫДЕЛЕНИЯ КЛЮЧЕВЫХ СЛОВ ДЛЯ СВЁРТЫВАНИЯ ТЕКСТА НЕОБХОДИМОСТЬ ВЫДЕЛЕНИЯ КЛЮЧЕВЫХ СЛОВ ДЛЯ СВЁРТЫВАНИЯ ТЕКСТА Даркулова К.Н., Ергешова Г. Южно-Казахстанский государственный университет им. Мухтара Ауэзова Шымкент, Казахстан В последние десятилетия в

Подробнее

Технология смыслового анализа и поиска информации КЛЮЧИ К ТЕКСТУ

Технология смыслового анализа и поиска информации КЛЮЧИ К ТЕКСТУ Технология смыслового анализа и поиска информации КЛЮЧИ К ТЕКСТУ М.Г. Крейнес, А.А. Афонин, А.В. Тихонов Рассмотрены особенности технологии смыслового анализа и поиска информации КЛЮЧИ К ТЕКСТУ, характер

Подробнее

ТЕХНОЛОГИЯ ПОЛНОТЕКСТОВОГО ПОИСКА В МУЛЬТИЯЗЫЧНЫХ СЕТЕВЫХ РЕСУРСАХ

ТЕХНОЛОГИЯ ПОЛНОТЕКСТОВОГО ПОИСКА В МУЛЬТИЯЗЫЧНЫХ СЕТЕВЫХ РЕСУРСАХ T E L ' 2 0 1 2 «Корпусы национальных языков: модели и технологии» ТЕХНОЛОГИЯ ПОЛНОТЕКСТОВОГО ПОИСКА В МУЛЬТИЯЗЫЧНЫХ СЕТЕВЫХ РЕСУРСАХ Д.В. Ландэ 1,2, д.т.н., В.В. Жигало 2 1 Институт проблем регистрации

Подробнее

СЕМАНТИЧЕСКАЯ БЛИЗОСТЬ И СЕМАНТИЧЕСКИЕ РАССТОЯНИЯ МЕЖДУ ТЕКСТАМИ

СЕМАНТИЧЕСКАЯ БЛИЗОСТЬ И СЕМАНТИЧЕСКИЕ РАССТОЯНИЯ МЕЖДУ ТЕКСТАМИ УДК 681.324 АСАУ 10(30) 2007 А.Ш. Сулейманов СЕМАНТИЧЕСКАЯ БЛИЗОСТЬ И СЕМАНТИЧЕСКИЕ РАССТОЯНИЯ МЕЖДУ ТЕКСТАМИ Формальные процедуры эсетного анализа предусматривают выделение в тексте терминологических

Подробнее

ДОКЛАДЫ БГУИР (81) МЕТОДЫ АВТОМАТИЧЕСКОГО ПОСТРОЕНИЯ РЕФЕРАТОВ НА ОСНОВЕ ЧАСТОТНОГО АНАЛИЗА ТЕКСТОВ Ф.И. ТРЕТЬЯКОВ, Л.В.

ДОКЛАДЫ БГУИР (81) МЕТОДЫ АВТОМАТИЧЕСКОГО ПОСТРОЕНИЯ РЕФЕРАТОВ НА ОСНОВЕ ЧАСТОТНОГО АНАЛИЗА ТЕКСТОВ Ф.И. ТРЕТЬЯКОВ, Л.В. ДОКЛАДЫ БГУИР 2014 3 (81) УДК 004.4 6:655.535.54 МЕТОДЫ АВТОМАТИЧЕСКОГО ПОСТРОЕНИЯ РЕФЕРАТОВ НА ОСНОВЕ ЧАСТОТНОГО АНАЛИЗА ТЕКСТОВ Ф.И. ТРЕТЬЯКОВ, Л.В. СЕРЕБРЯНАЯ Белорусский государственный университет

Подробнее

ЭТАПЫ СОЗДАНИЯ СТАТИСТИЧЕСКОГО ПЕРЕВОДЧИКА ПОТОКОВ НОВОСТЕЙ

ЭТАПЫ СОЗДАНИЯ СТАТИСТИЧЕСКОГО ПЕРЕВОДЧИКА ПОТОКОВ НОВОСТЕЙ ЭТАПЫ СОЗДАНИЯ СТАТИСТИЧЕСКОГО ПЕРЕВОДЧИКА ПОТОКОВ НОВОСТЕЙ Ландэ Дмитрий Владимирович, д.т.н., профессор НТУУ «КПИ», зам. директора ElVisti Жигало Владлен Викторович, аспирант, инж.-программист ElVisti

Подробнее

N - множество объектов обучающей выборки; N количество объектов обучающей выборки; C - номера классов (образов) целевой

N - множество объектов обучающей выборки; N количество объектов обучающей выборки; C - номера классов (образов) целевой Жвакин А.С., Софронов Ю.В. ООО «Информ-Консалтинг» Методы распознавания образов в подготовке нормативносправочной информации для АСУ На данный момент большинство успешных предприятий внедряет или активно

Подробнее

ПОДХОД К АВТОМАТИЗАЦИИ СБОРА ОНТОЛОГИЧЕСКОЙ ИНФОРМАЦИИ ДЛЯ ИНТЕРНЕТ-ПОРТАЛА ЗНАНИЙ 1

ПОДХОД К АВТОМАТИЗАЦИИ СБОРА ОНТОЛОГИЧЕСКОЙ ИНФОРМАЦИИ ДЛЯ ИНТЕРНЕТ-ПОРТАЛА ЗНАНИЙ 1 ПОДХОД К АВТОМАТИЗАЦИИ СБОРА ОНТОЛОГИЧЕСКОЙ ИНФОРМАЦИИ ДЛЯ ИНТЕРНЕТ-ПОРТАЛА ЗНАНИЙ 1 О.И. Боровикова olesya@iis.nsk.su Ю.А. Загорулько zagor@iis.nsk.su Е.А. Сидорова lena@iis.nsk.su Институт систем информатики

Подробнее

АВТОМАТИЗИРОВАННАЯ СИСТЕМА ОЦЕНКИ ЕСТЕСТВЕННОСТИ ТЕКСТОВ

АВТОМАТИЗИРОВАННАЯ СИСТЕМА ОЦЕНКИ ЕСТЕСТВЕННОСТИ ТЕКСТОВ АВТОМАТИЗИРОВАННАЯ СИСТЕМА ОЦЕНКИ ЕСТЕСТВЕННОСТИ ТЕКСТОВ А.В. Юрасов, О.А. Дегтярёва Самарский государственный аэрокосмический университет имени академика С.П. Королёва (национальный исследовательский

Подробнее

Анализ вопросов автоматизации поиска информации

Анализ вопросов автоматизации поиска информации УДК 025.4.03 Анализ вопросов автоматизации поиска информации Н. Ю. Рязанова 1 1 МГТУ им. Н.Э. Баумана, Москва, 105005, Россия Рассмотрены вопросы полнотекстового поиска и анализа текстовой информации для

Подробнее

Рис Виды моделирования систем

Рис Виды моделирования систем 1 Моделирование систем Классификация видов моделирования систем. В основе моделирования лежит теория подобия, которая утверждает, абсолютное подобие может иметь место лишь при замене объекта другим точно

Подробнее

Анализ формальных понятий и сжатие текстовой информации в задаче автоматизированного контроля знаний. Емельянов Г.М., Михайлов Д.В.

Анализ формальных понятий и сжатие текстовой информации в задаче автоматизированного контроля знаний. Емельянов Г.М., Михайлов Д.В. Анализ формальных понятий и сжатие текстовой информации в задаче автоматизированного контроля знаний. Емельянов Г.М., Михайлов Д.В. Новгородский государственный университет имени Ярослава Мудрого Настоящая

Подробнее

ЭКОНОМЕТРИКА. 7. Анализ качества эмпирического уравнения множественной линейной регрессии. t, (7.1) a j j a j. распределения Стьюдента.

ЭКОНОМЕТРИКА. 7. Анализ качества эмпирического уравнения множественной линейной регрессии. t, (7.1) a j j a j. распределения Стьюдента. Лекция 7 ЭКОНОМЕТРИКА 7 Анализ качества эмпирического уравнения множественной линейной регрессии Построение эмпирического уравнения регрессии является начальным этапом эконометрического анализа Построенное

Подробнее

7-я лекция. Эффективность информационных систем

7-я лекция. Эффективность информационных систем 7-я лекция. Эффективность информационных систем На прошедших лекциях мы рассматривали принципы действия информационных систем. Теперь сосредоточимся на вопросах оценки эффективности этого действия. Функция

Подробнее

Семантический анализ визуальной сцены

Семантический анализ визуальной сцены Семантический анализ визуальной сцены А.А. Харламов Институт высшей нервной деятельности и нейрофизиологии РАН kharlamov@analyst.ru Р.М. Жаркой Интеллектуальные системы безопасности roman.jarkoi@iss.ru

Подробнее

«Прикладная и математическая лингвистика»

«Прикладная и математическая лингвистика» ПРОГРАММА ВСТУПИТЕЛЬНОГО ЭКЗАМЕНА ПО СПЕЦИАЛЬНОЙ ДИСЦИПЛИНЕ для поступающих на основную образовательную программу послевузовского профессионального образования (аспирантура) Санкт-Петербургского государственного

Подробнее

общеупотребительной устаревшей

общеупотребительной устаревшей Прочитайте слова и запишите их, распределяя по группам: А) общеупотребительные; Б) устаревшие; В) неологизмы. Дискотека, целинник, макияж, флорист, ранец, видеомагнитофон, плейер, инфляция, аккредитация,

Подробнее

Алексеев Юрий Геннадьевич ИНТЕЛЛЕКТУАЛЬНЫЙ ФИЛЬТР ЭЛЕКТРОННЫХ СООБЩЕНИЙ

Алексеев Юрий Геннадьевич ИНТЕЛЛЕКТУАЛЬНЫЙ ФИЛЬТР ЭЛЕКТРОННЫХ СООБЩЕНИЙ Министерство образования Республики Беларусь Учреждение образования Белорусский государственный университет информатики и радиоэлектроники УДК 004.021 Алексеев Юрий Геннадьевич ИНТЕЛЛЕКТУАЛЬНЫЙ ФИЛЬТР

Подробнее

Методические рекомендации для самостоятельной работы обучающихся по дисциплине

Методические рекомендации для самостоятельной работы обучающихся по дисциплине ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ОБРАЗОВАНИЯ «ОРЕНБУРГСКИЙ ГОСУДАРСТВЕННЫЙ АГРАРНЫЙ УНИВЕРСИТЕТ» Методические рекомендации для самостоятельной работы обучающихся

Подробнее

В. В. НЕШИТОЙ МОДЕЛИРОВАНИЕ КРИВОЙ РОСТА И СТАТИСТИЧЕСКОЙ СТРУКТУРЫ СЛОВАРЯ КЛЮЧЕВЫХ СЛОВ

В. В. НЕШИТОЙ МОДЕЛИРОВАНИЕ КРИВОЙ РОСТА И СТАТИСТИЧЕСКОЙ СТРУКТУРЫ СЛОВАРЯ КЛЮЧЕВЫХ СЛОВ В. В. НЕШИТОЙ МОДЕЛИРОВАНИЕ КРИВОЙ РОСТА И СТАТИСТИЧЕСКОЙ СТРУКТУРЫ СЛОВАРЯ КЛЮЧЕВЫХ СЛОВ Рассматривается один класс случайных функций описывающих статистическую зависимость между количеством произведенных

Подробнее

1 Индекс (англ. «index», «code2, «notation», «mark», «symbol») условный знак (в

1 Индекс (англ. «index», «code2, «notation», «mark», «symbol») условный знак (в Занятие 14 Индексирование предоставляет возможность классифицировать документы посредством метаданных и словарного индекса 1 текста, извлечѐнного из документа. Индексирование (англ. «indexing») это процесс

Подробнее

Обзор современных лингвистических технологий и систем

Обзор современных лингвистических технологий и систем УДК 004.023 Обзор современных лингвистических технологий и систем К.И. Якубовский, К.А. Якубовская Московский государственный университет печати имени Ивана Федорова 127550, Москва, ул. Прянишникова, 2А

Подробнее

Модель алгоритмов классификации. информационный подход

Модель алгоритмов классификации. информационный подход : информационный подход МГУ имени М.В. Ломоносова, Москва, Россия e-mail: sgur@cs.msu.ru XXII Международная конференция «Математика. Экономика. Образование» 27 мая 3 июня 2014 г. / Краснодарский край,

Подробнее

МЕТОДИЧЕСКИЕ УКАЗАНИЯ ПО ВЫПОЛНЕНИЮ САМОСТОЯТЕЛЬНОЙ РАБОТЫ СТУДЕНТОВ

МЕТОДИЧЕСКИЕ УКАЗАНИЯ ПО ВЫПОЛНЕНИЮ САМОСТОЯТЕЛЬНОЙ РАБОТЫ СТУДЕНТОВ МИНОБРНАУКИ РОССИИ Федеральное государственное бюджетное образовательное учреждение высшего образования «Горно-Алтайский государственный университет» МЕТОДИЧЕСКИЕ УКАЗАНИЯ ПО ВЫПОЛНЕНИЮ САМОСТОЯТЕЛЬНОЙ

Подробнее

Лекция 17 ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ. Определение статистической гипотезы

Лекция 17 ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ. Определение статистической гипотезы Лекция 7 ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ ЦЕЛЬ ЛЕКЦИИ: определить понятие статистических гипотез и правила их проверки; провести проверку гипотез о равенстве средних значений и дисперсий нормально распределенной

Подробнее

ПОДХОД К СОЗДАНИЮ МНОГОЯЗЫЧНЫХ ПАРАЛЛЕЛЬНЫХ КОРПУСОВ ВЕБ-ПУБЛИКАЦИЙ

ПОДХОД К СОЗДАНИЮ МНОГОЯЗЫЧНЫХ ПАРАЛЛЕЛЬНЫХ КОРПУСОВ ВЕБ-ПУБЛИКАЦИЙ Конференция «Диалог 2009» ПОДХОД К СОЗДАНИЮ МНОГОЯЗЫЧНЫХ ПАРАЛЛЕЛЬНЫХ КОРПУСОВ ВЕБ-ПУБЛИКАЦИЙ Д.В. Ландэ, В.В. Жигало Информационный центр «ЭЛВИСТИ» ПРОБЛЕМАТИКА Описывается метод, с помощью которого реализуется

Подробнее

РЕФЕРАТ И АННОТАЦИЯ. ОБЩИЕ ТРЕБОВАНИЯ (ИСО ) Межгосударственный стандарт

РЕФЕРАТ И АННОТАЦИЯ. ОБЩИЕ ТРЕБОВАНИЯ (ИСО ) Межгосударственный стандарт ГОСТ 7.9-95 РЕФЕРАТ И АННОТАЦИЯ. ОБЩИЕ ТРЕБОВАНИЯ (ИСО 214-76) Межгосударственный стандарт Дата введения 1997-07-01 1. ОБЛАСТЬ ПРИМЕНЕНИЯ Стандарт предназначен для применения лицами и организациями, подготавливающими

Подробнее

А.Ю. Антонова, Э.С. Клышинский, Е.В. Ягунова ОПРЕДЕЛЕНИЕ СТИЛЕВЫХ И ЖАНРОВЫХ ХАРАКТЕРИСТИК КОЛЛЕКЦИЙ ТЕКСТОВ НА ОСНОВЕ ЧАСТЕРЕЧНОЙ СОЧЕТАЕМОСТИ 1

А.Ю. Антонова, Э.С. Клышинский, Е.В. Ягунова ОПРЕДЕЛЕНИЕ СТИЛЕВЫХ И ЖАНРОВЫХ ХАРАКТЕРИСТИК КОЛЛЕКЦИЙ ТЕКСТОВ НА ОСНОВЕ ЧАСТЕРЕЧНОЙ СОЧЕТАЕМОСТИ 1 А.Ю. Антонова, Э.С. Клышинский, Е.В. Ягунова ОПРЕДЕЛЕНИЕ СТИЛЕВЫХ И ЖАНРОВЫХ ХАРАКТЕРИСТИК КОЛЛЕКЦИЙ ТЕКСТОВ НА ОСНОВЕ ЧАСТЕРЕЧНОЙ СОЧЕТАЕМОСТИ 1 1. Введение Тексты разных функциональных стилей отличаются

Подробнее

DOI: /AUT

DOI: /AUT 30 АВТОМЕТРИЯ. 2016. Т. 52, 1 УДК 519.24 КРИТЕРИЙ СОГЛАСИЯ НА ОСНОВЕ ИНТЕРВАЛЬНОЙ ОЦЕНКИ Е. Л. Кулешов Дальневосточный федеральный университет, 690950, г. Владивосток, ул. Суханова, 8 E-mail: kuleshov.el@dvfu.ru

Подробнее

РЕПОЗИТОРИЙ БГУКИ ДВОЙСТВЕННАЯ ПРИРОДА РАНГОВЫХ РАСПРЕДЕЛЕНИЙ. г 1

РЕПОЗИТОРИЙ БГУКИ ДВОЙСТВЕННАЯ ПРИРОДА РАНГОВЫХ РАСПРЕДЕЛЕНИЙ. г 1 Особое место занимает ритмическое решение в частях Мессы А.Безенсон. В основе всей ритмической организации лежит ритмика древнейшего григорианского хорала, основанная на нерегулярном чередовании длинных

Подробнее

Словарь лексических валентностей в системе русскобелорусского

Словарь лексических валентностей в системе русскобелорусского Воронович В.В. Словарь лексических валентностей в системе русско-белорусского машинного перевода // Третьи чтения, посвященные памяти профессора В.А.Карпова. Сборник научных статей. Мн., 2009, с.108-111.

Подробнее

Лекция 8. Решающие деревья. Лектор Сенько Олег Валентинович. Курс «Математические основы теории прогнозирования» 4-й курс, III поток

Лекция 8. Решающие деревья. Лектор Сенько Олег Валентинович. Курс «Математические основы теории прогнозирования» 4-й курс, III поток Лекция 8 Решающие деревья Лектор Сенько Олег Валентинович Курс «Математические основы теории прогнозирования» 4-й курс, III поток Сенько Олег Валентинович () МОТП, лекция 2 1 / 15 Содержание лекции 1 Решающие

Подробнее

МЕТОДЫ ФОРМИРОВАНИЯ МНОЖЕСТВА АЛЬТЕРНАТИВ ПРОЦЕССА ФУНКЦИОНИРОВАНИЯ ЧЕЛОВЕКО- МАШИННЫХ СИСТЕМ НА ОСНОВЕ АНАЛОГИЙ

МЕТОДЫ ФОРМИРОВАНИЯ МНОЖЕСТВА АЛЬТЕРНАТИВ ПРОЦЕССА ФУНКЦИОНИРОВАНИЯ ЧЕЛОВЕКО- МАШИННЫХ СИСТЕМ НА ОСНОВЕ АНАЛОГИЙ СБОРНИК НАУЧНЫХ ТРУДОВ НГТУ. 2008. 1(51) 35 40 УДК 681.3 МЕТОДЫ ФОРМИРОВАНИЯ МНОЖЕСТВА АЛЬТЕРНАТИВ ПРОЦЕССА ФУНКЦИОНИРОВАНИЯ ЧЕЛОВЕКО- МАШИННЫХ СИСТЕМ НА ОСНОВЕ АНАЛОГИЙ М.Г. ГРИФ, Е.В. ГЕНИАТУЛИНА Показана

Подробнее

последовательность и предсказуемость отбора информации;

последовательность и предсказуемость отбора информации; Инструктивные материалы экспертной оценки отраслевых словарей и справочных изданий с точки зрения функционирования русского языка как государственного языка РФ 1. Основным типом терминологического отраслевого

Подробнее

ИТОГИ ПРОЕКТА АЙТИ И ВШЭ ТРИ ЗАДАЧИ ДЛЯ ВУЗА: КАК НЕ ПРОПУСТИТЬ НУЖНЫЙ ГРАНТ ИЛИ КОНКУРС НА НИОКР, НАЙТИ ЭКСПЕРТА В НАУЧНОЙ СРЕДЕ И ВЫЯВИТЬ ПЛАГИАТ

ИТОГИ ПРОЕКТА АЙТИ И ВШЭ ТРИ ЗАДАЧИ ДЛЯ ВУЗА: КАК НЕ ПРОПУСТИТЬ НУЖНЫЙ ГРАНТ ИЛИ КОНКУРС НА НИОКР, НАЙТИ ЭКСПЕРТА В НАУЧНОЙ СРЕДЕ И ВЫЯВИТЬ ПЛАГИАТ ИТОГИ ПРОЕКТА АЙТИ И ВШЭ ТРИ ЗАДАЧИ ДЛЯ ВУЗА: КАК НЕ ПРОПУСТИТЬ НУЖНЫЙ ГРАНТ ИЛИ КОНКУРС НА НИОКР, НАЙТИ ЭКСПЕРТА В НАУЧНОЙ СРЕДЕ И ВЫЯВИТЬ ПЛАГИАТ Дмитрий Романов, директор по развитию технологий информационного

Подробнее

УДК 004.932 Алгоритм распознавания заданных участков дорожно-транспортной инфраструктуры на аэрофотоснимках Косюра О.В., студент Россия, 105005, г. Москва, МГТУ им. Н.Э. Баумана, кафедра «Программное обеспечение

Подробнее

ЛИНГВИСТИКА ТЕКСТА И МАШИННЫЙ ПЕРЕВОД

ЛИНГВИСТИКА ТЕКСТА И МАШИННЫЙ ПЕРЕВОД УДК 800:681.3 А.Т.АБДЫШОВА ЛИНГВИСТИКА ТЕКСТА И МАШИННЫЙ ПЕРЕВОД Бул макалада тексттерди автоматикалык турдо иштетуу формаларын машиналык котормону колдонуулуп концептуалдуу суроолор каралган.илимий техникалык

Подробнее

КОМПЬЮТЕРНАЯ ЛИНГВИСТИКА И ОБРАБОТКА ЕСТЕСТВЕННОГО ЯЗЫКА ПРОГРАММНЫЕ СРЕДСТВА ВЫЯВЛЕНИЯ СЕМАНТИЧЕСКОГО ПОЛЯ СЛОВ

КОМПЬЮТЕРНАЯ ЛИНГВИСТИКА И ОБРАБОТКА ЕСТЕСТВЕННОГО ЯЗЫКА ПРОГРАММНЫЕ СРЕДСТВА ВЫЯВЛЕНИЯ СЕМАНТИЧЕСКОГО ПОЛЯ СЛОВ КОМПЬЮТЕРНАЯ ЛИНГВИСТИКА И ОБРАБОТКА ЕСТЕСТВЕННОГО ЯЗЫКА УДК 001.103:002 ПРОГРАММНЫЕ СРЕДСТВА ВЫЯВЛЕНИЯ СЕМАНТИЧЕСКОГО ПОЛЯ СЛОВ И. Е. Воронина, А. А. Кретов, О. С. Титова Воронежский государственный университет

Подробнее

Магистрант: Бименова Жанат Батырбековна Научный руководитель: к.ф.-м.н. Сидорова Елена Анатольевна

Магистрант: Бименова Жанат Батырбековна Научный руководитель: к.ф.-м.н. Сидорова Елена Анатольевна Магистрант: Бименова Жанат Батырбековна Научный руководитель: к.ф.-м.н. Сидорова Елена Анатольевна Разработка методов и средств автоматизации построения тезаурусов предметных областей 1 Цели работы Разработка

Подробнее

Лекция 3. Контент-анализ

Лекция 3. Контент-анализ Лекция 3. Контент-анализ Информационное поле субъекта это наиболее актуальная часть его картины мира, связанная с функционированием структур знания, это представления об объективном мире и происходящих

Подробнее

Представляемая работа посвящена взаимосвязанным проблемам (плакат 2) выделения единиц знаний из множества (корпуса) тематических текстов и отбора

Представляемая работа посвящена взаимосвязанным проблемам (плакат 2) выделения единиц знаний из множества (корпуса) тематических текстов и отбора Представляемая работа посвящена взаимосвязанным проблемам (плакат 2) выделения единиц знаний из множества (корпуса) тематических текстов и отбора текстов в корпус анализом релевантности исходной фразе.

Подробнее

Экспериментальное исследование методов выявления нечетких дубликатов научных публикаций

Экспериментальное исследование методов выявления нечетких дубликатов научных публикаций Экспериментальное исследование методов выявления нечетких дубликатов научных публикаций Дербенёв Н. В., Козлюк Д. А., Никитин В. В., Толчеев В. О. Кафедра Управления и информатики НИУ «МЭИ» ИОИ-2014, о.

Подробнее

Труды международной конференции Диалог 2007

Труды международной конференции Диалог 2007 Труды международной конференции Диалог 2007 ВЕРОЯТНОСТНЫЙ ПОДХОД К ЗАДАЧЕ РАЗРЕШЕНИЯ ОМОНИМИИ СЛОВ И СЛОВАРНЫХ ПАР A PROBABILISTIC APPROACH TO LEXICAL AMBIGUITY RESOLUTION OF WORDS AND WORD PAIRS Баглей

Подробнее

ПОСТРОЕНИЕ БАЗЫ ЗНАНИЙ ОБУЧАЮЩЕЙ ЭКСПЕРТНОЙ СИСТЕМЫ СРЕДСТВАМИ ИНЖЕНЕРИИ ЗНАНИЙ

ПОСТРОЕНИЕ БАЗЫ ЗНАНИЙ ОБУЧАЮЩЕЙ ЭКСПЕРТНОЙ СИСТЕМЫ СРЕДСТВАМИ ИНЖЕНЕРИИ ЗНАНИЙ в классе. В результате этой целенаправленной деятельности показатель усвоения данного элемента стал расти, и к концу 10-го класса вышел на уровень более 80%. Достаточно нетипичным оказался ход кривой (в),

Подробнее

О РАЗРАБОТКЕ РУССКО-АНГЛИЙСКОГО ТЕЗАУРУСА ПО КОМПЬЮТЕРНОЙ ЛИНГВИСТИКЕ

О РАЗРАБОТКЕ РУССКО-АНГЛИЙСКОГО ТЕЗАУРУСА ПО КОМПЬЮТЕРНОЙ ЛИНГВИСТИКЕ О РАЗРАБОТКЕ РУССКО-АНГЛИЙСКОГО ТЕЗАУРУСА ПО КОМПЬЮТЕРНОЙ ЛИНГВИСТИКЕ Загорулько Ю.А., Боровикова О.И., Кононенко И.С., Соколова Е.Г. Институт систем информатики имени А.П. Ершова СО РАН, Новосибирск Российский

Подробнее

ЛЯДОВА Ю.В. ПРОБЛЕМА СЛОВОСОЧЕТАНИЯ В СОВРЕМЕННОЙ ЛИНГВИСТИКЕ

ЛЯДОВА Ю.В. ПРОБЛЕМА СЛОВОСОЧЕТАНИЯ В СОВРЕМЕННОЙ ЛИНГВИСТИКЕ Лядова Ю.В. Проблема словосочетания в современной лингвистике / Ю. В. Лядова // Филологические науки в МГИМО: Сб. научных трудов / МГИМО(У) МИД России; Отв. ред. Л.Г. Кашкуревич. М.: МГИМО, 2004. С.120-124.

Подробнее

В.И. Гнатюк, 2014 Глава 4 Параграф Оценка адекватности моделирования

В.И. Гнатюк, 2014 Глава 4 Параграф Оценка адекватности моделирования В.И. Гнатюк, 4 Глава 4 Параграф 4 4.4. Оценка адекватности моделирования Оценка адекватности динамической адаптивной модели электропотребления техноценоза [9,] включает две основные процедуры. Первая заключается

Подробнее

Математическая статистика.

Математическая статистика. Лекция. Математическая статистика. Основной задачей математической статистики является разработка методов получения научно обоснованных выводов о массовых явлениях и процессах из данных наблюдений и экспериментов.

Подробнее

НАУЧНЫЙ СЕМИНАР «КОМПЬЮТЕРНАЯ ЛИНГВИСТИКА и TEXT MINING» Департамент анализа данных и искусственного интеллекта ФКН НИУ ВШЭ

НАУЧНЫЙ СЕМИНАР «КОМПЬЮТЕРНАЯ ЛИНГВИСТИКА и TEXT MINING» Департамент анализа данных и искусственного интеллекта ФКН НИУ ВШЭ НАУЧНЫЙ СЕМИНАР «КОМПЬЮТЕРНАЯ ЛИНГВИСТИКА и TEXT MINING» Департамент анализа данных и искусственного интеллекта ФКН НИУ ВШЭ НИС КЛиМТ : ПРЕПОДАВАТЕЛИ Большакова Елена Игоревна, к.ф-м.н, доцент Ефремова

Подробнее

Структура информации

Структура информации Структура информации При рассмотрении структуры информации выделяются отдельные еѐ элементы, которые могут быть и простыми и сложными. Простые элементы не поддаются дальнейшему расчленению; сложные образуются

Подробнее

ОСОБЕННОСТИ ИНФОЛОГИЧЕСКОГО МОДЕЛИРОВАНИЯ ЛИНГВИСТИЧЕСКИХ БАЗ ДАННЫХ (ЛБД)

ОСОБЕННОСТИ ИНФОЛОГИЧЕСКОГО МОДЕЛИРОВАНИЯ ЛИНГВИСТИЧЕСКИХ БАЗ ДАННЫХ (ЛБД) 1. Мицкевич, О.С. Особенности инфологического моделирования лингвистических баз данных / О.С. Мицкевич // Актуальные проблемы современных лингвистических исследований: сб. ст. Междунар. (заоч.) науч.-практ.

Подробнее

Автоматическая классификация текстовых документов с помощью онтологий

Автоматическая классификация текстовых документов с помощью онтологий УДК 005 Автоматическая классификация текстовых документов с помощью онтологий # 09, сентябрь 2012 Грушин М.А. Научный руководитель: д.т.н., профессор, Норенков И.П. МГТУ им. Н.Э.Баумана, Москва, Россия

Подробнее

ОСОБЕННОСТИ ФУНКЦИОНИРОВАНИЯ ИНТЕЛЛЕКТУАЛЬНОЙ ПОИСКОВОЙ СИСТЕМЫ

ОСОБЕННОСТИ ФУНКЦИОНИРОВАНИЯ ИНТЕЛЛЕКТУАЛЬНОЙ ПОИСКОВОЙ СИСТЕМЫ М.А. Шумская (Минск, МГЛУ) ОСОБЕННОСТИ ФУНКЦИОНИРОВАНИЯ ИНТЕЛЛЕКТУАЛЬНОЙ ПОИСКОВОЙ СИСТЕМЫ Современные информационно-поисковые системы, работающие с запросами пользователя в виде ключевых слов, характеризуются

Подробнее

Планирование полного двухфакторного эксперимента. Регрессионный анализ

Планирование полного двухфакторного эксперимента. Регрессионный анализ Министерство образования и науки Российской Федерации Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования «Московский государственный технический университет

Подробнее

Ассоциативные правила алгоритм Apriori [M.102]

Ассоциативные правила алгоритм Apriori [M.102] Ассоциативные правила алгоритм Apriori [M.102] При практической реализации систем поиска ассоциативных правил используют различные методы, которые позволяют снизить пространство поиска до размеров, обеспечивающих

Подробнее

ЯЗЫКОВОЕ ОБРАЗОВАНИЕ В КОНТЕКСТЕ НОВОЙ МЕЖКУЛЬТУРНОЙ ПАРАДИГМЫ

ЯЗЫКОВОЕ ОБРАЗОВАНИЕ В КОНТЕКСТЕ НОВОЙ МЕЖКУЛЬТУРНОЙ ПАРАДИГМЫ Н. А. Подобедова ЯЗЫКОВОЕ ОБРАЗОВАНИЕ В КОНТЕКСТЕ НОВОЙ МЕЖКУЛЬТУРНОЙ ПАРАДИГМЫ На современном этапе развития общества высшая профессиональная школа претерпевает значительные преобразования. Особую значимость

Подробнее

ПРОДВИЖЕНИЕ WEB-САЙТОВ НА ОСНОВЕ ДАННЫХ АССОЦИАТИВНЫХ ЭКСПЕРИМЕНТОВ

ПРОДВИЖЕНИЕ WEB-САЙТОВ НА ОСНОВЕ ДАННЫХ АССОЦИАТИВНЫХ ЭКСПЕРИМЕНТОВ Филиппович А.Ю., Кирнарский А.Б. ПРОДВИЖЕНИЕ WEB-САЙТОВ НА ОСНОВЕ ДАННЫХ АССОЦИАТИВНЫХ ЭКСПЕРИМЕНТОВ В настоящее время в среде Интернет активно развиваются технологии web 2.0 (wiki-ресурсы, социальные

Подробнее

Эконометрическое моделирование

Эконометрическое моделирование Эконометрическое моделирование Лабораторная работа 7 Анализ остатков. Автокорреляция Оглавление Свойства остатков... 3 1-е условие Гаусса-Маркова: Е(ε i ) = 0 для всех наблюдений... 3 2-е условие Гаусса-Маркова:

Подробнее

Лексический минимум как один из типов учебных словарей

Лексический минимум как один из типов учебных словарей Лексический минимум как один из типов учебных словарей Валентина В. Морозенко При внимательном рассмотрении учебных словарей, предназначенных для обеспечения курса «Иностранный язык» в вузах СССР, можно

Подробнее

К вопросу о создании учебного пособия в сфере профессионально-ориентированного обучения.

К вопросу о создании учебного пособия в сфере профессионально-ориентированного обучения. УДК 800.7 К вопросу о создании учебного пособия в сфере профессионально-ориентированного обучения. И.М. Галецкая, И.А. Ременникова Для обучения профессионально-ориентированному чтению на иностранном языке

Подробнее

Реализация алгоритма построения статистической модели объекта по методу Брандона. Постановка задачи

Реализация алгоритма построения статистической модели объекта по методу Брандона. Постановка задачи Голубев ВО Литвинова ТЕ Реализация алгоритма построения статистической модели объекта по методу Брандона Постановка задачи Статистические модели создают на основании имеющихся экспериментальных данных

Подробнее

Рабочая программа по русскому языку 3 класс Планируемые результаты изучения предмета «Русский язык» Личностными Метапредметными Предметными

Рабочая программа по русскому языку 3 класс Планируемые результаты изучения предмета «Русский язык» Личностными Метапредметными Предметными Рабочая программа по русскому языку 3 класс Планируемые результаты изучения предмета «Русский язык» Личностными результатами изучения русского языка в начальной школе являются: - осознание языка как основного

Подробнее

Пусть имеется множество произвольных объектов

Пусть имеется множество произвольных объектов АЛГОРИТМЫ КЛАСТЕРИЗАЦИИ Пусть имеется множество произвольных объектов. Кластеризация - это объединение объектов в группы (кластеры) на основе схожести признаков для объектов одной группы и отличий между

Подробнее

ГОСТ (ИСО ) СИБИД. Индексирование документов. Общие требования к координатному индексированию

ГОСТ (ИСО ) СИБИД. Индексирование документов. Общие требования к координатному индексированию ГОСТ 7.66-92 (ИСО 5963-85) СИБИД. Индексирование документов. Общие требования к координатному индексированию ОКСТУ 0007 Дата введения 1993-01-01 Информационные данные 1. РАЗРАБОТАН И ВНЕСЕН Государственным

Подробнее

Молодежная научная конференция «Все грани математики и механики» (24 30 апреля 2015 г.)

Молодежная научная конференция «Все грани математики и механики» (24 30 апреля 2015 г.) МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ НАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ ТОМСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ Механико-математический факультет Молодежная научная конференция «Все грани математики

Подробнее

Эконометрическое моделирование

Эконометрическое моделирование Эконометрическое моделирование Лабораторная работа 6 Анализ остатков. Гетероскедастичность Оглавление Свойства остатков... 3 1-е условие Гаусса-Маркова: Е(ε i ) = 0 для всех наблюдений... 3 Задание 1.

Подробнее

ИНФОРМАЦИОННАЯ СТРУКТУРА НАУЧНОГО ТЕКСТА. ТЕКСТ В КОНТЕКСТЕ КОЛЛЕКЦИИ

ИНФОРМАЦИОННАЯ СТРУКТУРА НАУЧНОГО ТЕКСТА. ТЕКСТ В КОНТЕКСТЕ КОЛЛЕКЦИИ Л.М. Пивоварова, Е.В. Ягунова (СПбГУ) Информационная структура научного текста. Текст в контексте коллекции // Труды международной конференции «Корпусная лингвистика 2011». СПб.: С.-Петербургский гос.

Подробнее

Таблица 1. Предметные результаты освоения учебного предмета «Русский язык» (со всеми дополнениями)

Таблица 1. Предметные результаты освоения учебного предмета «Русский язык» (со всеми дополнениями) Таблица 1. Предметные результаты освоения учебного предмета «Русский язык» (со всеми дополнениями) п/п ФГОС 2010 ФГОС 2015 1 Совершенствование видов речевой деятельности (аудирования, чтения, говорения

Подробнее

Лекция 5. Показатели вариации

Лекция 5. Показатели вариации Лекция 5. Показатели вариации Основные показатели вариации Вариация значений признака представляет наибольший интерес при исследовании социально-экономических явлений и процессов. Вариация колеблемость,

Подробнее

Статистическое моделирование

Статистическое моделирование Статистическое моделирование. Общая характеристика метода статистического моделирования На этапе исследования и проектирования систем при построении и реализации машинных моделей широко используется метод

Подробнее

КОМБИНАТОРНЫЕ ЧИСЛА ДЛЯ ПОДСЧЁТА РАЗБИЕНИЙ КОНЕЧНЫХ МУЛЬТИМНОЖЕСТВ В. В. Гоцуленко.

КОМБИНАТОРНЫЕ ЧИСЛА ДЛЯ ПОДСЧЁТА РАЗБИЕНИЙ КОНЕЧНЫХ МУЛЬТИМНОЖЕСТВ В. В. Гоцуленко. ПРИКЛАДНАЯ ДИСКРЕТНАЯ МАТЕМАТИКА 2013 Вычислительные методы в дискретной математике 422 УДК 5191 КОМБИНАТОРНЫЕ ЧИСЛА ДЛЯ ПОДСЧЁТА РАЗБИЕНИЙ КОНЕЧНЫХ МУЛЬТИМНОЖЕСТВ В В Гоцуленко Институт технической теплофизики

Подробнее

Законспектируйте его, используя вид конспекта - тематический обзорный (раскрывает конкретную тему с использованием нескольких источников).

Законспектируйте его, используя вид конспекта - тематический обзорный (раскрывает конкретную тему с использованием нескольких источников). Что такое конспект и как его составлять Конспект это последовательная фиксация информации, отобранной и обдуманной в процессе чтения. Конспект краткая запись содержания чего-нибудь, выделение главных идей

Подробнее

ТЕХНОЛОГИЯ ВЫЧИСЛИТЕЛЬНОГО ЭКСПЕРИМЕНТА ДЛЯ ОПЕРАТИВНОЙ ОЦЕНКИ ОПАСНОСТИ НАВОДНЕНИЙ. Бурцев А.А. Сибирский федеральный университет

ТЕХНОЛОГИЯ ВЫЧИСЛИТЕЛЬНОГО ЭКСПЕРИМЕНТА ДЛЯ ОПЕРАТИВНОЙ ОЦЕНКИ ОПАСНОСТИ НАВОДНЕНИЙ. Бурцев А.А. Сибирский федеральный университет УДК 004.89/504.75 ТЕХНОЛОГИЯ ВЫЧИСЛИТЕЛЬНОГО ЭКСПЕРИМЕНТА ДЛЯ ОПЕРАТИВНОЙ ОЦЕНКИ ОПАСНОСТИ НАВОДНЕНИЙ Бурцев А.А. Научный руководитель профессор Симонов К.В. Сибирский федеральный университет В настоящее

Подробнее

Программа элективного курса «В мире случайных закономерностей» (теория вероятностей с элементами комбинаторики и математической статистики)

Программа элективного курса «В мире случайных закономерностей» (теория вероятностей с элементами комбинаторики и математической статистики) «РАССМОТРЕНО» Муниципальное бюджетное общеобразовательное учреждение средняя общеобразовательная школа 11 города Невинномысска Ставропольского края на заседании МО учителей Протокол _1_ от «_29» _08._2013_г.

Подробнее

КОРРЕЛЯЦИОННЫЙ АНАЛИЗ ИЗМЕРЕНИЙ РЕЖИМНЫХ ПАРАМЕТРОВ В ЗАДАЧЕ УПРАВЛЕНИЯ ЭЛЕКТРИЧЕСКОЙ СИСТЕМЫ

КОРРЕЛЯЦИОННЫЙ АНАЛИЗ ИЗМЕРЕНИЙ РЕЖИМНЫХ ПАРАМЕТРОВ В ЗАДАЧЕ УПРАВЛЕНИЯ ЭЛЕКТРИЧЕСКОЙ СИСТЕМЫ УДК...0 КОРРЕЛЯЦИОННЫЙ АНАЛИЗ ИЗМЕРЕНИЙ РЕЖИМНЫХ ПАРАМЕТРОВ В ЗАДАЧЕ УПРАВЛЕНИЯ ЭЛЕКТРИЧЕСКОЙ СИСТЕМЫ Павлюков В.С., Павлюков С.В. Южно-Уральский государственный университет, г. Челябинск, Россия Основные

Подробнее

АКТУАЛЬНЫЕ ПРОБЛЕМЫ ЛИНГВИСТИКИ И ЛИТЕРАТУРОВЕДЕНИЯ

АКТУАЛЬНЫЕ ПРОБЛЕМЫ ЛИНГВИСТИКИ И ЛИТЕРАТУРОВЕДЕНИЯ Министерство образования и науки РФ Национальный исследовательский Томский государственный университет Филологический факультет ТГУ АКТУАЛЬНЫЕ ПРОБЛЕМЫ ЛИНГВИСТИКИ И ЛИТЕРАТУРОВЕДЕНИЯ Сборник материалов

Подробнее

ЛЕКЦИЯ 1. ОБОСНОВАНИЕ ПРИМЕНЕНИЯ В ЭВМ СИСТЕМ СЧИСЛЕНИЯ С ОС- НОВАНИЕМ 2. ФОРМУЛЫ ДЛЯ ГЕНЕРАЦИИ ПРОСТЫХ ЧИСЕЛ. АЛГОРИТМЫ КЛАСТЕРИЗАЦИИ.

ЛЕКЦИЯ 1. ОБОСНОВАНИЕ ПРИМЕНЕНИЯ В ЭВМ СИСТЕМ СЧИСЛЕНИЯ С ОС- НОВАНИЕМ 2. ФОРМУЛЫ ДЛЯ ГЕНЕРАЦИИ ПРОСТЫХ ЧИСЕЛ. АЛГОРИТМЫ КЛАСТЕРИЗАЦИИ. ЛЕКЦИЯ. ОБОСНОВАНИЕ ПРИМЕНЕНИЯ В ЭВМ СИСТЕМ СЧИСЛЕНИЯ С ОС- НОВАНИЕМ. ФОРМУЛЫ ДЛЯ ГЕНЕРАЦИИ ПРОСТЫХ ЧИСЕЛ. АЛГОРИТМЫ КЛАСТЕРИЗАЦИИ. НАИБОЛЕЕ ЭФФЕКТИВНОЕ ОСНОВАНИЕ СИТЕМЫ СЧИСЛЕНИЯ С ТОЧКИ ЗРЕНИЯ РЕАЛИЗАЦИИ

Подробнее

Обработка экспертных оценок и интерпретация результатов. 1.Введение

Обработка экспертных оценок и интерпретация результатов. 1.Введение Обработка экспертных оценок и интерпретация результатов. 1.Введение Целью обработки оценок является получение обобщенного мнения на основании множественных суждений экспертов. Совместной обработке обычно

Подробнее

Выявление аномальных значений [M.077]

Выявление аномальных значений [M.077] Выявление аномальных значений [M.77] Часто в больших наборах данных встречаются значения, которые не укладываются в общую модель поведения анализируемого процесса. Такие значения, которые сильно отличаются

Подробнее

Формирование понятия «полевая структура» в трудах Й.Трира

Формирование понятия «полевая структура» в трудах Й.Трира Мейрбекова М.М. Алматинский университет энергетики и связи Формирование понятия «полевая структура» в трудах Й.Трира Полевая модель системы языка в настоящее время получила довольно широкое распространение

Подробнее

Проверка статистических гипотез

Проверка статистических гипотез Проверка статистических гипотез 1. Статистические гипотезы; 2. Критерии проверки гипотез; 3. Проверка параметрических гипотез; 4. Критерий Пирсона Завершить показ Статистические гипотезы. Статистические

Подробнее

Корпус текстов как особый лингвистический ресурс

Корпус текстов как особый лингвистический ресурс Корпус текстов как особый лингвистический ресурс Содержание 1 Понятие и основные характеристики корпуса текстов 1.1 Размер и репрезентативность 1.2 Разметка 2 Виды разметки в корпусе 3 Основные этапы создания

Подробнее

3. ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ Основные понятия статистической проверки гипотезы

3. ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ Основные понятия статистической проверки гипотезы 3 ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ 3 Основные понятия статистической проверки гипотезы Статистическая проверка гипотез тесно связана с теорией оценивания параметров распределений В экономике, технике, естествознании,

Подробнее

ФОРМИРОВАНИЕ УМЕНИЙ СОЗДАНИЯ ВТОРИЧНЫХ ТЕКСТОВ НА ЗАНЯТИЯХ ПО ИНОСТРАННОМУ ЯЗЫКУ У СТУДЕНТОВ ФИЛОЛОГИЧЕСКИХ СПЕЦИАЛЬНОСТЕЙ

ФОРМИРОВАНИЕ УМЕНИЙ СОЗДАНИЯ ВТОРИЧНЫХ ТЕКСТОВ НА ЗАНЯТИЯХ ПО ИНОСТРАННОМУ ЯЗЫКУ У СТУДЕНТОВ ФИЛОЛОГИЧЕСКИХ СПЕЦИАЛЬНОСТЕЙ ФОРМИРОВАНИЕ УМЕНИЙ СОЗДАНИЯ ВТОРИЧНЫХ ТЕКСТОВ НА ЗАНЯТИЯХ ПО ИНОСТРАННОМУ ЯЗЫКУ У СТУДЕНТОВ ФИЛОЛОГИЧЕСКИХ СПЕЦИАЛЬНОСТЕЙ Журавкова Е.С. Белорусский государственный университет Как указано в одной из

Подробнее

И. А. Терентьева. Воронежский государственный университет Поступила в редакцию 27 марта 2011 г.

И. А. Терентьева. Воронежский государственный университет Поступила в редакцию 27 марта 2011 г. УДК 811.111 371 Частотность и хронология значений в трехзначных словах английского языка И. А. Терентьева Воронежский государственный университет Поступила в редакцию 27 марта 2011 г. Аннотация: в статье

Подробнее

Эконометрическое моделирование

Эконометрическое моделирование Эконометрическое моделирование Лабораторная работа Корреляционный анализ Оглавление Понятие корреляционного и регрессионного анализа... 3 Парный корреляционный анализ. Коэффициент корреляции... 4 Задание

Подробнее

Аннотация к рабочей программе. алгебра 7-9 классы

Аннотация к рабочей программе. алгебра 7-9 классы Аннотация к рабочей программе алгебра 7-9 классы Учебно-методический комплект (УМК) «Алгебра» (авторы: Макарычев Ю.Н., Миндюк Н.Г., Нешков К.И., Суворова С.Б. и др.) предназначен для 7-9 классов общеобразовательных

Подробнее

СОСТАВИТЕЛЬ: В.В. Воронович, старший преподаватель кафедры компьютерной лингвистики и лингводидактики Белорусского государственного университета

СОСТАВИТЕЛЬ: В.В. Воронович, старший преподаватель кафедры компьютерной лингвистики и лингводидактики Белорусского государственного университета 2 Учебная программа составлена на основе ОСВО первой ступени специальности 1-21 06 01 «Современные иностранные языки (по направлениям)», утвержденного постановлением Министерства образования РБ от 30.08.2013

Подробнее

ПРОГРАММА УЧЕБНОЙ ДИСЦИПЛИНЫ «МАТЕМАТИЧЕСКИЕ И СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ»

ПРОГРАММА УЧЕБНОЙ ДИСЦИПЛИНЫ «МАТЕМАТИЧЕСКИЕ И СТАТИСТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ» МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РФ ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ «МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ ГУМАНИТАРНЫЙ УНИВЕРСИТЕТ ИМЕНИ М.

Подробнее

Учреждение образования «Белорусский государственный университет культуры и искусств» РЕПОЗИТОРИЙ БГУКИ АВТОМАТИЗАЦИЯ ОБРАБОТКИ ТЕКСТОВОЙ ИНФОРМАЦИИ

Учреждение образования «Белорусский государственный университет культуры и искусств» РЕПОЗИТОРИЙ БГУКИ АВТОМАТИЗАЦИЯ ОБРАБОТКИ ТЕКСТОВОЙ ИНФОРМАЦИИ Учреждение образования «Белорусский государственный университет культуры и искусств» УТВЕРЖДАЮ Ректор БГУКИ Ю. П. Бондарь 2016 г. Регистрационный УД- /баз. АВТОМАТИЗАЦИЯ ОБРАБОТКИ ТЕКСТОВОЙ ИНФОРМАЦИИ

Подробнее

Синтез текстовой информации на английском языке при решении задач дистанционного обучения иностранному языку с использованием объектного подхода.

Синтез текстовой информации на английском языке при решении задач дистанционного обучения иностранному языку с использованием объектного подхода. Синтез текстовой информации на английском языке при решении задач дистанционного обучения иностранному языку с использованием объектного подхода. Н.В. Крапухина 1, С.Ю. Кулехин 2 В работе представлено

Подробнее

Лингвистика длинного хвоста. Николай Григорьев Отдел голосовых технологий

Лингвистика длинного хвоста. Николай Григорьев Отдел голосовых технологий Лингвистика длинного хвоста Николай Григорьев Отдел голосовых технологий Устройство Web-поиска Индекс: архив документов обратный индекс: по слову выдает все содержащие его документы данные о документах

Подробнее

Тест по Математическим методам в педагогике и психологии система подготовки к тестам Gee Test oldkyx.com

Тест по Математическим методам в педагогике и психологии система подготовки к тестам Gee Test oldkyx.com Тест по Математическим методам в педагогике и психологии система подготовки к тестам Gee Test oldkyx.com методы и способы сбора информации 1. Принято выделять следующие виды гипотез: 1) [-]подтверждающиеся

Подробнее

1) Содержание дисциплины

1) Содержание дисциплины Сведения по дисциплине «Информационные системы в управлении» 1) Содержание дисциплины ТЕМА 1. ИНФОРМАЦИОННЫЕ ПРОЦЕССЫ В СИСТЕМАХ УПРАВЛЕНИЯ. ИНФОРМАЦИОННОЕ ОБЕСПЕЧЕНИЕ УПРАВЛЕНИЯ ОРГАНИЗАЦИЕЙ Информационные

Подробнее

Об особенностях применения критерия согласия Пирсона χ 2

Об особенностях применения критерия согласия Пирсона χ 2 УДК 37814788:5192 Об особенностях применения критерия согласия Пирсона χ 2 Л М Гафарова, И Г Завьялова, Н Н Мустафин Национальный исследовательский университет «МИЭТ» Рассматриваются особенности и анализируются

Подробнее

Домашнее задание 2. Обработка результатов наблюдений двухмерного случайного вектора

Домашнее задание 2. Обработка результатов наблюдений двухмерного случайного вектора Домашнее задание. Обработка результатов наблюдений двухмерного случайного вектора.1. Содержание и порядок выполнения работы Дана парная выборка (x i ; y i ) объема 50 из двумерного нормально распределенного

Подробнее

6. КРИТЕРИИ ЗНАЧИМОСТИ И ПРОВЕРКА ГИПОТЕЗ

6. КРИТЕРИИ ЗНАЧИМОСТИ И ПРОВЕРКА ГИПОТЕЗ Проверка статистических гипотез 37 6. КРИТЕРИИ ЗНАЧИМОСТИ И ПРОВЕРКА ГИПОТЕЗ 6.. Введение В этой главе рассматривается группа статистических методов, которые получили наибольшее распространение в статистических

Подробнее