粤语数字化里程碑 广州大学发布 AI-DimSum多模态语料库平台

站长百科 2025-12-09 09:06www.1681989.com生活百科

在金秋时节的一个周末,即12月6日至7日,第十届语言服务高级论坛在广州大学盛大开幕。来自全国各地的语言专家齐聚一堂,共同语言服务的未来发展。在这一背景下,粤语语料库建设与大模型评测实验室发布了一项重大成果——AI-DimSum多模态粤语语料库平台。此次发布不仅为数字化时代的粤语发展开启了新的篇章,同时也标志着粤语在全球拥有上亿用户的语言社群迈入了全新的发展阶段。

粤语数字化里程碑 广州大学发布 AI-DimSum多模态语料库平台

论坛上,广州大学的教授齐佳音向众人介绍了粤语在网络世界中面临的挑战与机遇。粤语虽然博大精深,却一度面临着“低资源语言”的困境。但随着AI-DimSum多模态粤语语料库平台的诞生,这一困境得以突破。该平台以“数字中文建设”和“大湾区文化数字化”需求为导向,构建了一个基于岭南文化、面向AI应用的多模态语料数据生态系统。在设计理念上,遵循“标准先行、数据可溯、服务可用”的原则,确保平台的高效运作与数据的精准性。

随着技术的飞速发展,虚拟偶像、虚拟主播、虚拟人等新兴领域日益受到关注。AI-DimSum平台在这一背景下应运而生,不仅支持这些新兴领域的快速发展,更为其提供了海量的语料支撑。该平台汇聚了丰富的多模态资源,包括超过百万字的文本(涵盖新闻、文学等)、高达3000小时的音视频高保真语音标注以及超过1TB的音视频资料。值得一提的是,平台还收录了《功夫熊猫》、《大圣归来》、《外来媳妇本地郎》等带有粤语字幕与标注的作品,为语言研究和文化传承提供了宝贵的资料。

值得一提的是,该平台的评测系统构建了超过20万道粤语大模型内容安全多模态评测题,为粤语的应用和发展提供了强大的支撑。AI-DimSum平台的发布,不仅为粤语在数字化时代的发展提供了强大的技术支撑,同时也为其文化传承打开了新的大门。这一重要成果将极大地提升粤语在大模型时代的应用能力和文化传承价值。

此次论坛及AI-DimSum多模态粤语语料库平台的发布,无疑为粤语的发展注入了新的活力。它不仅展示了广州大学在语言学领域的深厚实力,更为整个社会对粤语的认知和应用提供了新的视角。未来,随着AI技术的不断进步,粤语将在数字化浪潮中绽放更加璀璨的光芒。

Copyright © 2016-2025 www.1681989.com 推火网 版权所有 Power by