7月5日,百度AI开发者大会在北京举行,在“开放创新 共襄AI未来”为主题的AI技术与开放平台分论坛上,百度副总裁、百度AI技术与平台体系(AIG)总负责人王海峰表示,百度几乎所有主要人工智能技术都已在搜索引擎中得到应用,来自搜索引擎及百度各产品的用户需求、数据和平台,支撑了百度AI技术的快速发展,现在百度人工智能在算法、数据、技术等方面具有领先优势。
“在每天数十亿次用户请求的千锤百炼下,百度的人工智能技术,是真正实用的人工智能技术,”王海峰认为,只有将技术与实际应用相结合,根据用户需求和反馈反复迭代优化,才能打造强大、更具活力的AI技术。
据悉,百度的AI能力分为4层:在基础层,是AI算法、大数据、大计算能力;感知层,包括语音、图像、视频、AR/VR等技术;认知层,有自然语言处理、知识图谱及用户画像等;在平台层,基础层、感知层、认知层的技术会平台化,通过百度AI开放平台ai.baidu.com开放,与开发者共享。
此次宣布开放的语音、自然语言处理、视频、增强现实、机器人视觉等技术,与已经开放的AI技术一起,构成具有60项开放技术的完整的、综合的AI开放平台,为开发者提供形式多样、可定制、可组合的AI技术,满足开发者从API、源码、数据到计算能力的多层次需求。数据显示,百度AI开放平台多项技术的使用量过去半年有2倍以上的增长。
语音交互成为人机交互的下一代入口,语音技术需求日益增加。百度语音技术部总监高亮在分论坛现场介绍了本次新开放的远场识别及语音唤醒、定制化语音合成、语音合成音色、 情感语音交互(Emotional CUI)等技术,开发者可以实现不同场景的智能应用,满足用户需求。
百度在开放语音技术,让机器听清用户的同时,更重要的是开放能让机器懂得用户需求的自然语言处理技术。此次分论坛由百度自然语言处理部总监赵世奇介绍了能力强大的语言理解与交互技术平台——UNIT。该平台将开放语言理解技术、交互技术,从百度大数据中自动汲取最有价值的数据提供给开发者使用,为开发者提供多种定制化方案,还首创『训练师』模式,助力开发者训练对话机器人,赋予机器“理解”自然语言,听懂用户需求,以及与用户进行多轮次对话的能力。
分论坛上,百度研究院院长林元庆介绍了视频分析与理解、机器人视觉和人脸识别等技术。本次开发者大会发布了全面的视频语义理解技术,包括视频封面选摘、视频分类、视频比对、细粒度识别、视频审核、视频公众人物识别、视频结构化分析等。此外,林元庆还介绍了世界第一个室外语义分割RGBD视频数据集,以及完整的机器人视觉解决方案。
增强现实(AR)技术作为全新的视觉交互形式,越来越受到营销、娱乐、游戏等行业关注。百度增强现实实验室主任吴中勤现场发布全新DuMix AR开放平台,为开发者提供AR SDK、内容制作工具、云端内容平台和内容分发服务。吴中勤表示,未来百度将提供更多场景的AR行业解决方案,赋能各行各业,共同探索AR价值。
在AI技术与开放平台分论坛上,除了发布新开放的核心技术能力,百度杰出科学家徐伟披露了PaddlePaddle的发展路径,宣布百度会开源代码、开放大规模数据集、开放计算能力、开放应用模型库。 |