В Китае создан монгольский лингвистический корпус
Академия общественных наук Внутренней Монголии заявила о запуске электронной базы корпуса монгольского языка, содержащей 80 млн. слов. Сбор данных и исследования в области корпусной лингвистики велись в течение десяти лет.
Монгольский корпус является частью корпуса, состоящего из 200 млн. слов и, включающего такие языки как даурский, эвенкийский и язык орокин. Все они распространены среди этнических меньшинств северного и северо-восточного Китая. Проект по созданию информационно-справочной системы планируется завершить в течение 20 лет.
Составителями выделены 97 местностей с монгольским населением в 8 провинциальных регионах. Также исследования проводились на территории 5 провинций и в городах Монголии, Республики Бурятия и Республики Калмыкия в России. Собрано 4,192 часа устных данных от 6,725 носителей монгольского языка, а также свыше 4,000 часов записанных данных.
По заявлению академии, проект по созданию корпусов призван защитить этнические языки от исчезновения и станет ценным лингвистическим ресурсом.
Проект состоит из двух этапов. Первый этап – сведение монгольского корпуса – завершен, и теперь предстоит второй этап по созданию базы данных еще трех языков.
Наша страница в WeChat sinocomclub