《2024中国力量年度人物》华为：用“AI”，为残障人士“智”造美好

2024-12-05 10:44:33 来源 : 今日热点网

由凤凰网和金种子酒业联合推出的《2024中国力量年度人物》活动正在进行,中国力量年度人物系列专题片正式上线。活动旨在表彰把握时代脉搏,积极探索新兴科技的新领域、新应用、新价值,以新质生产力创造美好生活的各领域杰出代表,弘扬中国榜样力量。

构建无障生活,消弭“数字鸿沟”

据世界卫生组织数据显示,全球有超过10亿人因残障而面临生活不便,在中国这一数字同样令人揪心。华为小艺声音修复项目负责人赵戈介绍道:在我国目前有约8500万残疾人口和超过2亿的65周岁以上老年人,其中视障者人数超过1700万,听障人员高达2700万,言语障碍人员有 700 多万,他们因为视觉障碍、听力障碍、言语障碍等因素,严重影响着日常生活,更在社交、教育、就业等多个方面面临重重阻碍。近年来,在无障碍环境领域如何以新质生产力去推进信息无障碍,消弭“数字鸿沟”的话题,正日益受到社会各界的广泛关注。数字时代,科技的每一次进步都深刻地影响着大众切身利益,对于残障人士来说,他们面临着与世界沟通的巨大挑战,而新的科技革命正在改变着更多残障人士的工作和生活。

华为HarmonyOS智能终端操作系统具备强大的技术功能和多项优势,仅用了短短数年时间就实现了覆盖10亿生态设备的壮举,成为智能终端领域的闪耀之星,为我国推动新质生产力发展提供了重要契机。一直以来,华为都坚持“科技不让任何人掉队”是企业义不容辞的长期社会责任,今年,华为将「小艺」正式升级为「小艺智能体」,它能够实现在端云大模型协同和意图框架的加持下获得更好的场景感知、意图识别和用户理解能力,能够帮助用户更好地获取所需个性化服务。在华为开发者大会(HDC 2024)上,HarmonyOS NEXT首次将AI与OS深度融合,推出小艺声音修复功能等创新产品,通过精准识别言语障碍人士的口语发音,将其转化为标准普通话进行复述,让他们的声音更加清晰、标准,以华为鸿蒙为代表的新质生产力,正在以独特方式让残障人群感受到技术所带来的前所未有的便利与温暖。

让每一次发声,都掷地有声

华为终端在最新发布的HarmonyOS NEXT中推出了业界首创的小艺声音修复功能,它是利用先进的AI技术,对用户的语音进行实时分析、修复和优化,协助言语障碍人群进行交流。它在修复声音的同时,也保留了每个人独有的声音特点,不仅提升了发音的可懂度,还尽可能地让每一句话都能清晰、自然地传递出去。修复语障人士的发音帮助其进行正常交流,过去这项技术在业界并没有同行涉足,在项目发展的战略方向和商业应用前景上都存在着诸多不确定性,华为小艺声音修复项目团队需要面临的是从零到一的过程。尽管有着较多不确定性因素,项目团队仍然不计较短期利益的得失,毅然决定立项攻关,谈到项目立项初衷,信息无障碍产品经理伟华说道:“海伦凯勒曾经说过:‘看不见阻隔了人与物,听不见阻隔了人与人’,我们希望通过 AI 赋能残障人群,去帮助每一位残障用户感知到现实世界当中的温暖美好,表达出自己的真实需求和情感。”

小艺声音修复产品经理焕忠介绍道:开口说话,不是人人与生俱来的能力。言语障碍患者会出现说话费力、沟通困难、口音异常等表现,部分患者对语言的理解也存在障碍。言语障碍人群根据其口语表现和程度、发音器官的结构和功能等因素,由重至轻分为一至四级,而声音修复的功能主要针对四级和三级言语障碍人群所设计。通过构建言语障碍人士专用的语音识别大模型和语音合成大模型,项目团队搭建了一个端到端的声音修复系统,它无需文本输入,可以直接实现:修复前语音输入——修复后语音输出的流程,言语障碍者能够轻松享受无障碍沟通的便利。团队中的技术专家耿博表示:信息无障碍的推行,需要我们将残障用户纳入“健全用户”序列,将他们的需求与健全人群的需求同等看待,并在产品和服务的设计上做到一视同仁,所以在进行声音修复功能模型搭建的时候,我们需要同时解决可懂度、韵律和音色三大问题。项目前期面临的最大难题是声音数据缺乏,而为了实现这项功能,团队耗时数月采集了大量声音数据,再通过声音大模型进行训练,并且每天都根据训练情况对声音修复模型进行细致调整。在整个团队的努力下,目前小艺声音修复功能在尽可能保持用户个人音色的前提下,声音修复后的可懂度平均提升到百分之八十以上,这意味着,无论是四级语障用户还是三级语障用户,都能借助这一功能与他人进行更顺畅清晰的沟通,减少生活中的沟通障碍。

而在帮助视障用户方面,华为团队在HarmonyOS NEXT上积极探索基于AI大模型的视觉辅助功能,借助手机摄像头和AI大模型,小艺拥有多模态交互的能力,例如:视障用户拿取冰箱内的蔬菜和食物时,在小艺的协助下,可以了解到蔬菜的新鲜度、状态、色泽的分析与食用建议,犹如佩戴上一双“电子眼”,让视障人群的生活品质得到提升。为了给AI模型提供准确、真实的残障人士数据,华为团队选择和全国200多家聋/盲协会合作,深入全国88个城市开展了220多场华为无障碍功能体验活动,最终获得累计140000小时的第一手资料。

华为团队明白:最需要AI的,恰恰是看起来距离AI最远的人群——残障人群,他们正在用科技的温度与力量去打破固有的偏见,去让残障人群拥有感受正常生活的权利,去让我们能够“听见”他们的声音,也让他们能够“看见”这个世界。

科技向善,有“AI”无“碍”

2019年,华为提出了TECH4ALL数字包容倡议与行动计划,聚焦于公平优质教育、保护脆弱环境、促进健康福祉和推动均衡发展四大领域。帮助障碍群体更好融入数字世界是“促进健康福祉”的核心方向之一,华为将这一理念深度融入到终端产品的设计与服务中,让每一个人能够平等地享受科技带来的便利与温暖。

除了残障人士之外,在中国还有着近2亿的65周岁以上老年人,存在着部分因受教育水平限制,对科技使用存在信息障碍的人群。为此,在信息无障碍领域,华为团队不仅推出了小艺声音修复功能,还通过AI字幕、小艺通话、智能问答等功能,为残障用户、老年人群、信息接收存在障碍人群等多类群体提供全方位的无障碍服务。这些功能的推出,不仅提升了相关用户的生活质量,也展现了华为终端持续聚焦信息无障碍的坚定承诺和深厚情怀。