走进浙大校园 吴甜分享百度AI的核心技术
原标题:走进浙大校园 吴甜分享百度AI的核心技术
90分钟超时放送、1.4万字干货解读,这位人工智能行业的稀缺女将,究竟返校说了啥?近日,浙江大学第二期“互联网+”创新创业大讲堂准时“云端”开课,百度集团副总裁吴甜作为本期主讲嘉宾为学弟学妹们带来《人工智能技术的实践与创新》的分享。
成都创新互联坚持“要么做到,要么别承诺”的工作理念,服务领域包括:成都网站建设、做网站、企业官网、英文网站、手机端网站、网站推广等服务,满足客户于互联网时代的大同网站设计、移动媒体设计的需求,帮助企业找到有效的互联网解决方案。努力成为您成熟可靠的网络建设合作伙伴!时值毕业季,吴甜以浙大师姐的身份开启了在线讲堂,以工作为例,生动又系统的讲解了人工智能技术的实践与创新,帮助学弟学妹们加深对人工智能行业的了解,并解答了关于AI技术发展的专业问题。在线收听的浙大师生们频频向这位新晋“技术流主播”双击点赞,不少参与者在收听分享后,纷纷表示不过瘾,希望师姐“加更”。
近十年,人工智能逐渐走入人们的视野,成为大热风口,但在此之前,吴甜就已经专注于人工智能领域多年,且见证了NLP等基础技术的快速发展。此次,吴甜从百度AI技术展开,详细介绍了百度大脑的技术布局,从领先性及易用便捷角度介绍了作为重要开发工具的深度学习平台飞桨,以及语义理解技术解决方案文心ERNIE和智能对话定制与服务平台 UNIT,并围绕新冠疫情带来百度AI在战疫方面的突出表现。在分享最后,吴甜也针对听课群体的特点,描绘了深度学习开发者的学习地图,介绍了AI Studio学习实践社区、各类AI大赛、亿元算力支持、AI人才认证、就业、PPDE计划等百度在AI人才培养方面的诸多举措,希望帮助更多学弟学妹通过飞桨的社区和平台能够与更多的开发者交流,收获成长。
吴甜介绍,百度大脑由基础层、感知层、认知层和平台层以及AI安全组成。基础层为大数据、算法以及算力的支撑;感知层包括语音、视觉以及AR、VR等能力;认知层主要包括自然语言处理和知识图谱;平台层包括飞桨、百度大脑开放平台等,助力AI应用创新;此外还有AI安全技术进行保驾护航。
语音技术作为重要的基础技术,一直保持高速发展,吴甜用视频案例为大家展示了语音技术的发展水平。基于百度自主研发的SMLTA流式多级截断注意力模型,语音识别准确度大幅提升。2019年百度输入法发布会上,一段中英混杂的“职场rap”被百度输入法准确识别,语音识别已达到中英文自由切换均可高质量识别的水平。在一段“调戏”小度音箱的视频中,打开小度的极客模式,不仅不需重复“小度小度”唤醒词,小度还可以准确区分对话与需求,而这正是全双工免唤醒能力的体现,在此能力下,人机交互越来越顺畅。吴甜还为大家播放了多种不同风格的音频,而这些可以媲美人声的音频都是由AI语音合成,并通过风格和音色迁移技术实现的。
小浦、移娃等数字人小姐姐的出现,收获了现场一大波点赞。在谈到虚拟形象合成技术时,吴甜播放了一段数字人合集视频,来自百度智能云与浦发的小浦、中国移动的移娃、澎湃的小菲等虚拟数字人都源于相同的虚拟形象合成技术,但形象风格各不相同,在百度技术的支持下虚拟数字人“女团”也将走入更多行业。
除了类比人的感知能力的语音视觉技术,还有类比人认知能力的语言与知识技术。
吴甜详解了基于知识图谱的视频理解,在感知技术提取特征的基础上,融合了知识推理和计算,对整个视频的内容有更深度的理解。此外,语言和知识技术在医疗行业的应用,也可以在辅助诊疗、合理用药、病历质控等场景起到切实的帮助作用。百度研发的ERNIE全面刷新了NLP多项任务的效果,机器同传方面,百度先后提出了一系列新模型,在语音容错、平衡质量与时延、语篇翻译连贯性和端到端同传模型等方面取得突破,并研发了高质量、低时延的机器同传系统。在疫情特殊时期,支持了多场远程会议直播的同声传译。
“深度学习框架在技术栈当中的位置类似于操作系统的位置。因为它向下和芯片、指令集的设计相关,向上和大量的应用场景是非常相关的。”在介绍了各种技术成果后,吴甜带领大家将目光转向AI开发平台及工具层面。百度的深度学习平台飞桨是国内首个开源开放、技术领先、功能完备的产业级深度学习平台,包含核心框架、基础模型库、端到端开发套件以及工具组件,具有开发便捷的深度学习框架、超大规模深度学习模型训练技术、多端多平台部署的高性能推理引擎以及产业级开源模型库,四大技术优势。近期,飞桨还针对旺盛的产业需求推出了企业版,包含零门槛AI开发平台EasyDL,以及面向大企业的全功能AI开发平台BML。
此外,吴甜还着重提到了飞桨的预训练+迁移技术。她介绍,飞桨提供了许多基于百度大数据所训练出来的预训练模型,这些网络结构复杂的大模型与特定场景中的小数据量进行迁移学习之后,可以形成非常出色的场景模型。比如,口罩人脸检测模型正是基于ICCV19 Wider Challenge人脸检测竞赛冠军底座模型,加上真实口罩数据微调实现的。在垃圾分类场景中,飞桨也起到了提高效率、准确率的作用。据吴甜介绍,采用飞桨的目标检测和图像分割模型,可以实现塑料瓶的细分以及塑料瓶中心点的检测,使垃圾分拣更准确高效,同时通过Paddle Lite,可以高效部署集成到垃圾分拣的产线上。在武汉的一家垃圾分拣厂,采用了这样一套技术解决方案后,分选效率从93%左右提升到了97%以上,替代了4-6个操作工人的人力成本。
NLP的研发范式也已进入以预训练+微调的全新时代,依托于ERNIE的技术突破,百度推出了语义理解技术解决方案,旨在让企业简单、高效灵活地定制开发最领先的NLP模型。目前,文心通过飞桨企业版EasyDL、BML为企业提供平台化服务。以百度Feed流应用为例,文心ERNIE技术解决方案,使得视频推荐的相关性提升了8%,更好地满足了用户需求。
吴甜还介绍了可以帮助使用者快速构建专属对话产品的对话平台百度UNIT。她从任务式对话和问答对话等方面深入浅出地展示了UNIT在定制对话过程中起到的作用。针对不同的对话需求,UNIT均提供了相应的技术与功能支持。同时,在对长对话的理解处理,与语音技术的融合方面,UNIT也做了很多工作。以智能客服为例,UNIT不仅能听懂用户的诉求,还能基于与用户的对话分析发掘用户深度的诉求。
在疫情期间,百度与合作伙伴,生产了一系列的AI抗疫产品,比如社区疫情防控系统、疫情问答机器人、地铁口罩检测等等,快速实现了应用落地,为疫情防控提供了及时有力的帮助,用科技创造了价值。
同时,百度一直致力于打造AI学习社区。比如AI Studio为广大开发者的学习与实训,提供了超过45万个精选项目,亿元免费算力;算法赛、创意赛、产业赛三大类型赛事全年无休,以赛促学,近一年累计举办50多场,这些对于学生群体进行开发带来便捷。
分享最后,浙大学子踊跃提问,吴甜一一解惑,分享了关于医疗AI、通用型NLP、强化学习等方向的见解。吴甜认为,AI需要跟行业自身的问题结合进去,通过飞桨等平台、工具与行业场景相结合,在应用中不断迭代。关于人工智能的边界问题,吴甜表示“人工智能技术与应用越来越广泛结合,在能够定义问题的场景中发挥出了其价值,但有如通用对话系统是通向通用人工智能的重要技术突破,这个突破还未真正到来”。
分享文章:走进浙大校园 吴甜分享百度AI的核心技术
网页地址:http://cdiso.cn/article/cgjsic.html