Самое горячее: Европа признала соцсети опасными (50); "Фобос-Грунт" уже не спасти (11); Мобильники убивают детей (26); ЕЩЕ >>
РАЗДЕЛЫ
Архив
« июнь 2020  
пн вт ср чт пт сб вс
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30          

Национальный корпус русского языка

Анатолий Ализар
| архивная статья | 28.04.2004 12:18

В интернете открыт для свободного доступа Национальный корпус русского языка объемом более 20 млн. слов. Это универсальный лингвистический справочник, который представляет собой собрание грамматически размеченных русских текстов XIX-XXI вв. в электронной форме, удобной для автоматического поиска и научных исследований.

В состав Корпуса входят тексты самых разных жанров, причем не только произведения художественной литературы, но также — в сбалансированном объеме — научные, научно-популярные, религиозные и иные сочинения, публицистика, производственно-технические, юридические и многие другие тексты, интересные с лингвистической точки зрения. Справочник максимально представительно отражает русский литературный язык во всем многообразии его письменных форм. Он похож на обычную электронную библиотеку типа Lib.ru, но только здесь все тексты снабжены специальной лингвистической разметкой («аннотацией»).

Корпус русского языка — это уникальный лингвистический инструмент, создание которого было важнейшей задачей национального значения. Большинство крупных языков мира уже имеет свои национальные корпуса, различающиеся по полноте и уровню научной обработки текстов. Общепризнанным образцом является Британский национальный корпус: на него ориентированы многие другие аналогичные справочники, в том числе великолепный Чешский национальный корпус, созданный в Карловом университете Праги.

Создание Национального корпуса русского языка восполняет пробел в отечественном языкознании и переводит научное изучение и преподавание русского языка в качественно новые условия. Новым сайтом могут бесплатно воспользоваться все, кто интересуется вопросами, связанными с русским языком: профессиональные лингвисты, преподаватели, школьники и студенты, иностранцы, изучающие русский язык, и т.д.

Поиск по корпусу с учетом морфологии, расстояния и грамматических признаков, осуществляется «Яндексом». «Мы с удовольствием приняли участие в этом проекте, — говорит Илья Сегалович, технический директор Яндекса. — Грамматически аннотированный корпус есть не только способ изучения языка, но и важный общедоступный инструмент для создания и настройки программных средств, работающих с русскими текстами».

разделы:

Другие

Последние комментарии
об издании | тур по сайту | подписки и RSS | вопросы и ответы | размещение рекламы | наши контакты | алфавитный указатель

Copyright © 2001-2020 «Вебпланета». При перепечатке ссылка на «Вебпланету» обязательна.

хостинг от .masterhost