В Китае создан монгольский лингвистический корпус

Академия общественных наук Внутренней Монголии заявила о запуске электронной базы корпуса монгольского языка, содержащей 80 млн. слов. Сбор данных и исследования в области корпусной лингвистики велись в течение  десяти лет.

Монгольский корпус является частью корпуса, состоящего из 200 млн. слов и, включающего такие языки как даурский, эвенкийский и язык орокин. Все они распространены среди этнических меньшинств северного и северо-восточного Китая. Проект по созданию информационно-справочной системы планируется завершить в течение 20 лет.

Составителями выделены 97 местностей с монгольским населением в 8 провинциальных регионах. Также исследования проводились на территории 5 провинций и в городах Монголии, Республики Бурятия и Республики Калмыкия в России. Собрано 4,192 часа устных данных от 6,725 носителей монгольского языка, а также свыше 4,000 часов записанных данных.

По заявлению академии, проект по созданию корпусов призван защитить этнические языки от исчезновения и станет ценным лингвистическим ресурсом.

Проект состоит из двух этапов. Первый этап – сведение монгольского корпуса – завершен, и теперь предстоит второй этап по созданию базы данных еще трех языков.

Наша страница в WeChat sinocomclub

По любым китайским вопросам пишите на почту 15045064735@163.com

Валерий Толстой
Все записи

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *

Пожалуйста, напишите ваше имя.
Пожалуйста, напишите ваш email.

три × два =

Пожалуйста, напишите комментарий.