我国推出全新入门测试工具助企业更安全部署生成式AI应用

数码发展及新闻部兼卫生部高级政务部长陈杰豪星期四（5月29日）在新加坡亚洲科技会展的亚洲科技峰会上发表开幕主旨演讲时，正式发布生成式人工智能（AI）应用入门测试工具。（李冠卫摄）

我国发布全新生成式人工智能的入门测试工具，在人工智能快速发展的大环境下，帮助企业更有信心、更负责任地部署大型语言模型的相关应用。

数码发展及新闻部兼卫生部高级政务部长陈杰豪星期四（5月29日）在新加坡亚洲科技会展（Asia Tech x SG）的亚洲科技峰会（ATxSummit）上发表开幕主旨演讲时，正式发布生成式人工智能（AI）应用入门测试工具（Testing Starter Kit for GenAI Applications）。

根据资讯通信媒体发展局的文告，工具由资媒局参考人工智能验证基金会（AI Verify Foundation）与超过30家企业在全球AI安全保障试点中的实地测试经验，以及最新的研究成果整合而成。

工具旨在为业界提供一套自愿采纳的测试指导方针，帮助开发者识别、解决生成式AI在实际应用中常见的四大主要风险：

一、模型生成不实、缺乏依据或不完整的内容的幻觉现象（hallucination）；

二、输出对个人、社群或公共利益造成伤害的信息等不当内容；

三、无意间泄露个人或机构的敏感资料；

四、接到恶意指令（adversarial prompts）时，生成危险内容的风险。

延伸阅读

本地自主研发医疗AI模型白内障手术审核加快90%

数码发展及新闻部兼卫生部政务部长拉哈尤出席活动时致辞说，人工智能在改变我们治疗和照顾病患的方式，它在支持医护人员，以及建设更具韧性的卫生系统方面拥有巨大潜力。（郑一鸣摄）

升级版大语言模型MERaLiON 2.0 日后可用方言与年长者对话

来自人工智能科技公司Axiom的软件工程师李云康为媒体演示搭载MERaLiON 2.0大语言模型的手机应用如何与年长者对话。它不仅能实时生成对话文本，还能识别年长者语气中含有的快乐、悲伤、愤怒等情绪，并进行标注。（郑一鸣摄）

除了测试指导方针，工具也将配有多项可直接部署的测试工具，并逐步通过“登月计划”（Project Moonshot）平台上线。现阶段已有七项基础测试可供使用，未来将根据公众反馈持续增补。

“登月计划”是我国去年在亚洲科技峰会上推出的全球首个大型语言模型测试工具之一。它不仅能在人机对话中识别含有暴力、煽动仇恨等不良的本土化内容，也体现我国在生成式人工智能领域前沿探索未知、拓宽边界的勇气和决心。

生成式AI应用入门测试工具，星期四起展开为期四周的公众咨询，并将不断完善更新。

陈杰豪指出，人工智能发展虽带来巨大潜能，但也引发对工作、经济及社会影响的深层忧虑。因此，必须在信任的基础上，发展可持续的AI生态系统。

他也宣布，新加坡全国人工智能核心计划（AI Singapore，简称AISG）与联合国开发计划署（UNDP）签署谅解备忘录，合作将“AI向善”计划推广至东南亚、加勒比海及太平洋岛国等发展中地区。这一计划原先于2024年在本地启动，目标是提升全民AI素养，尤其惠及边缘群体与教育界。

我国推出全新入门测试工具 助企业更安全部署生成式AI应用

延伸阅读

我国推出全新入门测试工具助企业更安全部署生成式AI应用