业界在部署生成式人工智能应用时,固然可以大幅提升工作效率,但若没有发现一些重大风险,可能使用户信任、企业声誉受损,甚至引发法律问题。我国发布全新生成式人工智能入门测试工具,在人工智能快速发展的大环境下,帮助企业更有信心、更负责任地部署大型语言模型的相关应用。

数码发展及新闻部兼卫生部高级政务部长陈杰豪星期四(5月29日)在新加坡亚洲科技会展(Asia Tech x SG)的亚洲科技峰会(ATxSummit)上发表开幕主旨演讲时,正式发布生成式人工智能(GenAI)应用入门测试工具。

根据资讯通信媒体发展局的文告,工具由资媒局参考人工智能验证基金会(AI Verify Foundation)与超过30家企业在全球AI安全保障试点计划中的实地测试经验,以及最新的研究成果整合而成。它为业界提供一套自愿采纳的测试指导方针,帮助开发者识别、解决生成式AI在实际应用中常见的四大主要风险:

1)模型生成不实、缺乏依据或不完整内容的幻觉现象(hallucination);

2)输出对个人、社群或公共利益造成伤害的信息等不当内容;

3)无意间泄漏个人或机构的敏感资料;

4)接到恶意指令(adversarial prompts)时,生成危险内容 。

“登月计划”推进AI安全测试 我国迈向可持续AI生态

延伸阅读

除了测试指导方针,工具也将配有多项可直接部署的测试工具,并逐步通过“登月计划”(Project Moonshot)平台上线。现阶段已有七项基础测试可供使用,未来将根据公众反馈持续增补。这份文件星期四起至6月25日,展开公众咨询,并将不断完善更新。公众可上资媒局网站查阅。

“登月计划”是我国去年在亚洲科技峰会上推出的全球首个大型语言模型测试和评估工具之一,它不仅能在人机对话中识别含有暴力、煽动仇恨等不良的本土化内容,也体现我国在生成式AI领域前沿探索未知、拓宽边界的勇气和决心。

陈杰豪指出,人工智能发展虽带来巨大潜能,但也引发对工作、经济及社会影响的深层忧虑。因此,必须在信任的基础上,发展可持续的AI生态系统。

陈杰豪说:“要充分发挥人工智能的效益,我们同样须要赋能于人——无论是与AI互动的日常使用者、与它并肩工作的员工,还是能决策应用方式的领导者。”

他也宣布,新加坡全国人工智能核心计划(AI Singapore,简称AISG)与联合国开发计划署(UNDP)签署谅解备忘录,合作将“AI向善”计划推广至东南亚、加勒比海及太平洋岛国等发展中地区。这一计划原先于2024年在本地启动,目标是提升全民AI素养,尤其惠及边缘群体与教育界。“人工智能不能只是强加在人们身上的技术,而应是他们能塑造、理解,也能从中受惠的工具。”

陈杰豪也提到,在全球AI安全保障试点告一段落之际,当局已整理出一份报告,总结企业与测试专家在实践中的关键经验。