2021-02-05 分类: 网站建设
刚刚,百度一年AI成绩单官宣。
作为中国AI头雁,百度的成绩单不止代表巨头公司业绩,也代表了技术前沿现状和产业基本情况。
而且诸多进展,也是全新起跑线上全球AI发展的侧影,比如最明显的4大趋势特点:
所以百度这份2019年度成绩单,究竟说了啥?又体现了哪些行业共同趋势?
我们提纲挈领、抓取归纳其中要点,从点到面一文看懂。
整份成绩单中,技术突破与生态建设是重中之重,占据了一半篇幅。
剩下的一半中,应用落地与产业升级占据了很大篇幅。
这也体现出了AI当前发展阶段——技术仍旧占据核心,但落地以及产业应用正在被放到更加重要的位置。
整体上来看,百度的成绩单可以分为三大部分:
首先看基础研究,一年包揽了23项国内外竞赛冠军。
集中于百度大脑,语音、视觉、自然语言处理、知识图谱等方面都有成果出现。
特别是语音语言,在2019年迎来阶段性丰收时刻。
语音识别方面,百度提出了流式多级的截断注意力模型 SMLTA,这是全球范围内首次实现流式注意力建模,超越整句注意力模型的性能,大幅提升了语音识别准确率和速度(15%-20%),也是国际上首次实现在线语音识别大规模使用注意力模型。
语音合成方面,针对风格迁移、音色模拟和情感拟人的三大领域内挑战,百度推出语音合成技术 Meitron ,仅需20句话就可以制作一个人的专属声音。
此外,作为认知智能的“奥林匹克”,自然语言处理技术(NLP)的进展在今年最为夺目,全球亮点频出。
代表中国“参赛”的百度,交出了可持续学习的知识增强语义理解框架ERNIE(艾尼),在16 个中英文任务上超越BERT、XLNET,取得SOTA 。
2019年12月,ERNIE在GLUE上登顶第一,并以9个任务平均得分首次突破90大关,刷新榜单历史,超越微软、谷歌提出的一众国际顶级预训练模型。
基于语音和语言方面的突破,百度还提出了基于深度注意网络的多轮响应选择匹配模型——DAM,口语理解能力被大幅提升。
值得一提的是,虽然全球范围内视觉为核心的感知智能已经迈步广泛落地应用期,但在2019年,百度还是秀出了“百尺竿头更进一步”的基础研发实力。
除了形成包括图像、视频、AR/VR、重要垂类、软硬一体化五大方向的特色视觉技术矩阵。
百度还在CVPR 2019豪夺10项冠军,包括OCR、物体检测、视频理解、目标跟踪等图像与视频技术领域。
此次AI复兴,除了算法,另一项重要基础变革在于计算力。
百度也在成绩单中详细分享了突破:
2019年12月,基于百度自主研发的中国首款云端全功能AI芯片“昆仑”的云服务器正式上线,在150瓦功耗下能带来260万亿次定数的AI运算,提供512GB/s的内存带宽。
量产了专为远场语音交互打造的百度鸿鹄芯片,100mW 左右平均工作功耗,即可支持远场语音交互核心的阵列信号处理和语音唤醒能力等等。
而且,百度的算力发展并不仅仅只是单点发展,也已经与算法、飞桨框架连点成线,并交织成了坚实的基础层,形成了协同效应。
通过芯片、连接、系统和调度的协同设计和技术创新,对AI计算架构进行升级,可以提供百万TOPS的强大算力。
正在建造的计算集群,基于百度飞桨研发的AI控制系统,设计年均PUE1.15,基础设施能耗降低70%,每个可用区每年节电超过2亿度,相当于10万户居民一年的用电量。
下一代计算——量子计算方面也有新突破。
研发出国际、国内第一的云上量子脉冲系统“量脉”,可将量子计算软件指令(逻辑门)转换成控制量子硬件的脉冲序列,算法性能较同类工具实现成倍的提升,是实现量子软硬件连接的关键桥梁。
当然,区别于科研机构,百度作为企业组织,基础技术突破自然不会止步于理论本身。
在技术转化成生产力方面,百度展示了一幅AI落地全景图。
百度旗下的多款应用与业务中已经转换成了AI引擎,而且其也正在开放能力,共享产业升级红利。
在
小度助手5.0 援引第三方机构数据,第二季度小度系列智能音箱出货量位居全球第二、国内第一,同比增长率高达3700%。而且技术突破和落地,也进一步打破产品旧边界。作为“音箱”被归类的AI交互硬件,在小度系狂飙突进下,开始真正展现AI时代交互终端的样子——AI音箱不再是音箱。
百度输入法方面,刚才提到的重要基础突破,流式截断的多级注意力模型(SMLTA)已经上线,效果立竿见影,在线语音识别相对准确率,比同领域最优玩家还有高15%。
好消息是,离线语音识别准确率已经达到在线识别水平,且可以实现高精准中英文混合语音输入、方言免切换语音输入,这也是业内首次。
在机器翻译方面,继提出了多任务学习、多智能体联合训练等前沿方法,在2019年WMT评测中取得中英翻译第一,提出了首个具有预测和可控时延的同传模型,也是首个语义单元驱动的上下文同传模型,并研发了语音到语音的同传系统,无需经过语音识别转录,同样是业内首次。
而视觉为代表的感知智能落地,最具业内反响的是自动驾驶。
在业内“华山论剑”顶会CVPR 2019,百度Apollo公开了国内唯一的纯视觉L4级自动驾驶解决方案——Apollo Lite,能够支持对10路摄像头、200帧/秒数据量的并行处理,单视觉链路高丢帧率能够控制在5‰以下,实现全方位360°实时环境感知,前向障碍物的稳定检测视距达到240米。
相比旋转式激光雷达感知方案,视觉感知方案价格低廉且便于获得。并以计算机视觉和AR技术研发了一种增强现实的自动驾驶仿真系统(AADS),使用激光雷达(LiDAR)和相机扫描街景。
合成虚拟形象也是今年最“性感”的落地应用之一,并且达到了量产的水平。
百度与央视合作打造AI虚拟主持人小灵,亮相央视2019五四晚会;与澎湃新闻合作打造了第一个真人形象的虚拟主播早晚新闻栏目;与浦发银行合作打造了业内首个“金融数字人”。
基于知识图谱的视频语义理解,则已经在百度视频搜索、推荐、内容生成等多个产品上线。
通过对视频的视觉、语音、文本的多模态知识解析,在多元异构知识图谱上建立关联,并通过计算推理,建立对视频的深度语义理解,大幅度提升视频理解效果。
而且AI落地在今年也不再阳春白雪,更多接地气、可以被寻常百姓家感知的科普式方案也引起反响。
比如百度AI开发者大会上,打造了能说会道的机器臂“茶博士”。
利用3D视觉技术,可以对茶杯的位置进行检测和追踪。通过机器人运动规划和控制,可以对工作空间进行碰撞检测,避开障碍物。完成实时规划运动后,可自动生成倒茶轨迹。语音语义联动技术解析,更是让机器人像“人”一般,听得懂,说得好,做得准。
最后,有技术、有落地应用之外,百度更宏大的雄心也徐徐展露——基于技术与应用优势,百度希望更进一步:打造平台,打造生态,成为AI世界的底座。
今年成绩单中,开发生态方面的数据同样非常醒目。
从百度当前的业务布局来看,其已形成了4大底座平台:
并且在2019年都实现了爆发。
百度大脑开放平台已经在语音、视觉、语言等方面实现全面升级,具备深度学习框架、场景化AI能力、定制化训练平台到软硬一体模组和解决方案等。
自2016年以来,百度已开放228项AI能力,开发者数量超过150万,日均调用量突破1万亿次,语音、人脸、NLP、OCR调用量中国第一,是业内最全面、最、服务规模大的AI开放平台。
援引IDC最新报告,百度飞桨与谷歌、Facebook名列前三,领衔中国深度学习平台市场,也是市场份额前五中唯一的国货。
Apollo自动驾驶开放平台已经汇聚了全球156家生态合作伙伴;在全球,有97个国家超过3.6万名开发者使用Apollo开源代码,开源代码数量超过65万,已成为全球最强大、最开放、最活跃的自动驾驶平台。
而且开放能力进一步打破边界,在刚召开的首届Apollo生态大会上,百度Apollo拓展裂变成三大平台:自动驾驶开放平台、车路协同开放平台,智能车联开放平台,成为中国自动驾驶基建国家队代表。
小度技能开放平台上,技能开发者数量已经超过3.7万人,可提供包括游戏、效率工具、网络电台、直播、儿童教育、智能家居等3500多种技能支持。合作伙伴数量已经超过500家,可以控制的IoT智能家居设备已经超过了7000万。
此外,百度还开源了中国首个边缘计算框架BAETYL、自研底层区块链技术,并发布了多个工业级的领域数据集,如大规模自动驾驶数据集、街景图像数据和文字场景数据集、视频精彩片段、场景解析、机器阅读理解、中文句子及相应的开放域信息提取事实数据集等等,来促进算法研究,推动AI发展。
比如下图,就是ApolloScape数据集示例:上半截为彩色图像,下半截是其二位语义标签:
正如百度董事长兼CEO李彦宏所说:“作为一家平台级企业,成就他人、造福社会,这是百度创始初心与能力之所在,更是百度在行业发展关键时刻责无旁贷之所在!”
正是基于如此,百度才能够通过百度智能云的“云+AI”能力,为各行各业大规模输送百度的AI技术成果与平台能力,成效也非常显著。
根据IDC在11月底发布的中国AI云服务市场报告,百度智能云在AI技术、市场和商业上处于中国地位,超过了阿里云、AWS等一众厂商。
百度CTO王海峰感慨,百度在2019年提出“人工智能进入工业大生产阶段”,如今他们已经探索了AI进入“工业大生产”的真实路径,推动AI迈入自动化、标准化和模块化的新阶段,并与百度业务以及各行各业的生产实践深入结合,加速产业智能化进程。
在互联网、金融、智能城市、工业制造等行业已经拥有标杆性落地案例。
比如,与中国联通打造的智能客服已经在中国联通三省一基地上线;与央视网共建人工智能研发中心,打造媒体行业的AI软硬件产品;与精研科技打造智能质检车间,提升制造业质检效率,降低用工成本等等。
但百度的技术,并不仅仅希望体现在商业价值上,还希望通过社会价值,展现AI福祉。
成绩单中披露,2019年“百度 AI 寻人”平台,用户发起照片比对超过了36万次,9000多个走失者与家庭重新团聚。
百度还发布了听障儿童无障碍阅读计划,推出了全球首款听障儿童AI手语翻译小程序,能将绘本文字翻译为手语,帮助听障儿童实现无障碍阅读。
此外还将AI应用在了台风路径查询、濒危土家语保护、改造盲人按摩院等方面,进一步发掘AI价值。
所以百度AI如何回答2019?上述种种业绩就是关键要素。
而且巨头玩家年度交卷,自然也是整个AI产业的共性、趋势反映。
正所谓窥一斑见全豹,百度的成绩单又反映出怎样的AI 2019?
或许你会疑惑,百度上述新突破、新进展,为何发生在2019?
背后有百度的技术积累开花结果,但也是AI发展进程使然。
这也是为什么百度的2019更值得被复盘解读,其中展示全球AI领域发展的六大趋势。
趋势一:CV之后,NLP领域成为下一个突破频出的领域
在百度交出的AI成绩单中,更多的AI突破与生产力转换都集中在语音语言理解方面。
比如语音识别、语音合成、虚拟主播、机器翻译、人机对话、知识图谱等等,并落地到了小度助手、百度地图、百度视频等等产品与应用之中。
这也体现出了整个人工智能当前的技术突破集中点:自然语言处理方向。
计算机视觉是人工智能产业中最为成熟的方向,人脸识别已经进入了寻常百姓家,整个方向彻底进入落地期。
早年围绕这一技术发展起来的第一波AI独角兽,也已经在想办法向更多的方向拓展。旷视发力IoT供应链,依图做起了芯片,而商汤在教育、AR、自动驾驶方向频频发力等等。
与此形成对应的是,NLP方向突破频频。谷歌的BERT直接催生出了更多的变体,机器在自然语言处理与语义理解上更为突出,GPT-2的问世也进一步彰显出了整个方向的创造力与活力。
众所周知,AI可以被划分为“感知智能”和“认知智能”两大版块。
但2012年ImageNet石破天惊开始,感知智能的进展要好于认知领域,直观类比来说,感知就像一个人类能考到95分的试卷,而认知领域,够到及格还挑战连连。
于是2019年,全新气象和里程碑进展频频,以语言语音为代表的认知,进入突破期。
趋势二:落地为王,价值重估,AI发展回归理性
2019年,整个人工智能产业变得更加务实。
绚丽的Demo少了,关于将AI应用到产品、落地到场景中呼声更多了。
这是对前些年人工智能领域“大跃进”的最直接回应,AI发展理性回归,从资本方到企业,整个行业的参与者都在要求AI展示“降本增效”,来转化成真实的生产力。
2019年的百度,在落地与AI生产力转换方面再明显不过。
最典型如自动驾驶领域有L4级视觉感知解决方案Apollo Lite和增强现实的自动驾驶仿真系统,对于自动驾驶落地,全球都在要求进入“平民”时代,依靠堆高精尖传感器的“贵族”玩法,市场空间越来越小。
这也是全球自动驾驶经受重估的一年。
国际上,Waymo模式遭遇质疑和重估,摩根大通将其估值调低40%,而在货运领域自动驾驶落地则热火朝天,两种不同形态一对比,才知道“看不见的手”想要的不再是遥远的迷人图景,它想要的是——少废话,证明价值吧。
趋势三:人工智能进入工业大生产阶段,需要标准化、自动化和模块化
在谈到人工智能的时候,很多人都会将其提为“新一轮的科技革命”,并将其比作蒸汽、电力等等。
但现实给出的种种反馈都颇为直接地展现出,在给出这一结论的时候,要用将来时态。从现在到将来缺了什么?
王海峰在2019年提出观点称,前三次工业革命的核心技术都具有很强的通用性,呈现出标准化、自动化和模块化的工业大生产特征。
而人工智能想要如此,自然也需要具备这些特征。这也是人工智能产业向前发展的根本所在。
前些年的人工智能落地,都体现在一个case接一个case的模式,现在进入工业大生产阶段,则要求人工智能体现出更加通用特征,一个产品能够处理多个case,人工智能的能力要标准化、自动化和模块化。
百度的成绩单中,百度大脑、飞桨、小度助手、Apollo等平台,都是百度对这一趋势给出的回应。
飞桨、Apollo等开放平台被国际知名第三方机构波士顿咨询,作为中国AI发展的代表,并在全球范围内与谷歌相提并论,认为开放平台正是巨头优势和推动智能化变革的关键。
由此第四大趋势
分享标题:百度交出年度AI成绩单:斩获23项冠军,国产自研成大趋势
文章起源:/news1/99201.html
成都网站建设公司_创新互联,为您提供全网营销推广、动态网站、App开发、星空体育app最新版本(2024已更新)、面包屑导航、定制开发
声明:本网站发布的内容(图片、视频和文字)以用户投稿、用户转载内容为主,如果涉及侵权请尽快告知,我们将会在第一时间删除。文章观点不代表本网站立场,如需处理请联系客服。电话:028-86922220;邮箱:631063699@qq.com。内容未经允许不得转载,或转载时需注明来源: 创新互联
猜你还喜欢下面的内容