国学官网|国学学院 |资讯| 汉字| 汉语| 语林| 文库| 论坛
□ 站内搜索 □
请输入查询的字符串:
标题查询 内容查询
□ 同类目标 □
  • 资讯
  • 汉字
  • 汉语
  • 语林
  • 文库
  • □ 同类热点 □
  • 孔子学院总部在北京正式成立
  • 《汉语九百句》来得很及时
  • 全球中文教师缺口大 教老外汉语成时髦职业
  • 海外孔子学院怎样上课?
  • 全球化的汉语学习可能是“身不由己”?
  • 英语读音竟用汉字标注
  • 韩国用四字成语总结2006年
  • 《中国语言文字大词典》将在内地香港同步出版
  • 提高汉语水平柬埔寨端华学校举行查字典比赛
  • 非洲兴起“汉语热”北京峰会后发展前景更喜人
  • 应对汉语热潮 美国福遍学区拟改进中文教学
  • 美国亚洲研究协会举行“中文教学讲座”
  • 中国辞书的“强国梦”还有多远
  • 阅读世界名著可以从小学开始
  • 新加坡推广中文有新招:看时事漫画学习华语
  • 当前类别:官网 >> 新版国学 >> 汉语 >> 资讯
    “蒙古语语料库”二期工程:填补互联网文献空白

    发布时间: 2018/11/27 0:23:45 被阅览数: 次 来源: 中国新闻网
    文字 〖 〗 )
    中新网呼和浩特11月26日电 (记者 李爱平)内蒙古自治区社会科学院“蒙古语语料库”首席专家巴特尔26日向中新网记者介绍,正在实施的“蒙古语语料库”二期工程(简称二期工程)总字数将达到1.2亿词,目前已完成佛教重要典籍《甘珠尔经》的录入工作。其最大意义在于“填补互联网上无蒙古文文献的空白,最终能使蒙古学学者有文献可用”。
      巴特尔对记者透露,二期工程“文献语料库”是“扫描文件、电子文档、拉丁文转写”三位一体的大型蒙古文文献语料库。
      巴特尔表示,二期工程语料库有三大特点:第一、穷尽式收集自蒙古文第一份文献成吉思汗碑以及《蒙古秘史》等中世纪文献,好中选优《黄金史》《甘珠尔经》《御制清文鉴》等木刻板文献,均衡选录社会科学、自然科学、报纸、政治、法律、文学、医学、农牧业、应用、口语等10大类文献;第二、遵循文献学原则,即每份文献提供原图、录入文件、拉丁文标音三种形式;第三、语料库实现免费在线网络查询检索。
      巴特尔告诉记者,二期工程自2015年实施近三年来,截至目前已完成13世纪—16世纪中世纪文献、17世纪—18世纪近代文献(大部分)、19世纪现代文献部分和20世纪—21世纪当代文献部分,约完成8000万字语料的录入校对工作。
      “蒙古语语料库建设工程”是“一次规划,多年实施”的中国首个蒙古语、达斡尔语、鄂温克语、鄂伦春语大型综合性语料库。它涵盖言语语料和文献语料两部分,总字数将达到2亿词。
      2005年“蒙古语语料库建设工程”确立为内蒙古自治区民族文化大区建设重点项目,设计20年完成。一期工程言语语料库(2005-2014)已于2014年11月验收,二期工程文献语料库(2015-2024)正在实施。
      巴特尔表示,一期工程言语语料库(8000小时语料)旨在大规模搜集真实言语语料,重点在中国八省自治区、蒙古国四省一市、俄罗斯布里亚特共和国和卡尔梅克共和国境内97个点采访了6725人,搜集蒙古语、达斡尔语、鄂温克语、鄂伦春语自然口语语料4192小时(相当于4000多万词)。它是已建成的世界上最大的蒙古语自然口语语料库。同时还完成了4000多小时的书面语语料库。两项合计“蒙古语语料库建设工程”一期工程共完成了8000多小时的言语语料。
      在巴特尔看来,二期工程的实施,不仅对蒙古语等少数民族语言(文字)的规范化、信息化和内蒙古语言生活的健康和谐发展,具有重要的理论意义,也对保护、传承和开发、利用民族语言文化遗产,维护中国语言文化安全具有重要的现实意义。(完)
    编辑:秋痕

    中国将打造1.2亿词级蒙古文文献语料库

    |关于我们 | 招聘信息 |联系我们 |友情链接 |相关介绍 |免责申明 |
    copyright©2006 Power By confucianism®  中国国学网版权所有    蜀ICP备16005458号