现在的位置:首页 / 青海要闻

联合青海师范大学省部共建 “云藏”打造国家重点实验室云藏基地 用户已覆盖70多个国家和地区

来源:西海都市报     发布时间:2023-03-28     作者:马璞馨

黄南新闻网讯  全国首个藏文搜索引擎——“云藏”上线以来,不断升级更新系统,研究核心技术。那么,“云藏”是什么,它的功能究竟有多强大?

藏文信息技术研究中心矗立在海南藏族自治州共和县城北新区,研究中心是一处集研发、应用、培训、体验和成果展销服务为一体的多功能多业务孵化基地,共有藏文数据中心、产品展销中心、小微企业孵化中心三个功能区,这里是“云藏”的诞生地。“云藏”既是搜索引擎,也是针对互联网的藏文信息化资源,方便群众了解新闻、文库、百科等内容,涵盖30多个领域。

一个搜索引擎一部百科全书

海南州藏文信息技术研究中心党组书记多科告诉记者,“云藏”搜索主要由网页搜索、新闻搜索、图片搜索、音乐系统、视频系统、百科系统、文库系统、知道系统等组成,采用目前最主流的算法,研发藏文自动分词与语言分析系统,建设大规模训练语料库,开发网页采集、全文搜索、内容管理模块、搜索网站前台等系统架构建设,完成网页搜索等多个应用系统的建设工作。

“‘云藏’就像是一部百科全书。”多科说,其中,“云藏建设”有藏文文献经典5万部、“云藏百科”知识达8万余条、“云藏文库”文档达18万余篇、“云藏知道”问答达6万余个。研究中心夯实数据资源,加快推进藏文信息化进程,保护中华优秀传统文化,建设藏文分词标注语料近700万词次、汉藏平行语料100万句对、语音语料2万条、依存句法1万句,为进一步深入研发汉藏机器翻译、藏语语音识别及合成奠定了坚实基础。

目前,云藏搜索引擎通过等保三级测评,云藏输入法通过等保二级测评,增设国家通用语言文字学习视频等专栏,实现云藏高效爬虫及检索系统优化与集成,同时持续更新云藏App及云藏输入法,不断提升云藏平台性能。

用户覆盖全球70多个国家和地区

海南州藏文信息技术研究中心副主任官却多杰说,“云藏”自成立以来,持续进行技术迭代更新,推出云藏新版App和云藏输入法两大应用,总下载量达300万次,“云藏”用户已覆盖全国34个省级行政区,全球70多个国家和地区,总点击量达56亿次,实名注册用户达8.6万余人。

近几年,研究中心不断夯实数据,立项新版系统,主要对查准率、查全、爬虫、检索等各方面升级,解决系统拥堵的问题。

“目前正在推进前端内容,有海量的代码需要做,完善系统要花费10个月。”官却多杰说。

“云藏”的核心是数据库。按照我省省部共建藏语文处理及应用基地要求,“云藏”还计划开发自己的语音识别软件和机器人。海南州通过不断引进人才,已编制完成云藏“十四五”规划前期重点项目可研报告,申报获批青海省藏文信息技术科研科普基地,衔接青海师范大学国家重点实验室等。

在省州党委政府的协调推动下,在省科技厅的大力支持下,3月24日,省部共建藏语智能信息处理及应用国家重点实验室云藏基地正式挂牌,基地以建设国家可持续发展议程创新示范区为引领,依托海南州大数据产业,进一步加强与国家重点实验室合作交流,优化平台内容,扩大服务范围,提升综合能力,筑牢安全防线,为推动地区高质量发展作出“云藏”贡献。

[责任编辑:海燕]