语音识别

演讲实录丨王海峰:AI 新基建加速产业智能化

前提是你 提交于 2020-09-29 10:56:09
  7月25日-26日,在中国科学技术协会、中国科学院、中国工程院、浙江省人民政府、杭州市人民政府、浙江省人工智能发展专家委员会指导下,由中国人工智能学会、杭州市余杭区人民政府主办,浙江杭州未来科技城管理委员会承办的2020全球人工智能技术大会在“数字之都”——杭州,成功举办。在7月25日举办的 大会主旨报告 环节 , 百度首席技术官、ACL/CAAI Fellow 王海峰 为我们带来了题为 “AI 新基建加速产业智能化” 的精彩演讲。      王海峰 百度首席技术官、ACL/CAAI Fellow    以下是王海峰的演讲实录:   我今天与大家分享的主题是《AI 新基建加速产业智能化》。   新基建通过建设新型基础设施,促进经济高质量发展。具体来讲,新型基础设施包括信息基础设施、融合基础设施和创新基础设施。这些新型基础设施以新发展理念为引领,以技术创新为驱动,以信息网络为基础,面向高质量发展,提供数字转型、智能升级和融合创新等服务。AI 既是新基建重点建设的新型基础设施,同时也与其他新型基础设施有重要的协同效应。   现阶段,AI 已经成为新一轮科技革命和产业变革的重要驱动力量,正在引领人类社会进入第四次工业革命。从人类历史上的历次工业革命来看,其核心技术都有很强的通用性。例如第一次工业革命的机械技术,第二次工业革命的电气技术,以及第三次的信息技术,都是如此

网易数帆基础软件平台获2020南京软博会年度创新产品奖

倾然丶 夕夏残阳落幕 提交于 2020-09-29 06:01:29
2020第十六届中国(南京)国际软件产品和信息服务交易博览会(以下简称南京软博会)顺利拉开帷幕,以“数字经济 智创未来”为主题,重点展示工业互联网、云计算、5G、人工智能等数字经济新产业新业态。 与往届不同,今年首次设立了信息技术应用创新展区,国产基础软件创新成为会场热词; 网易数帆基础软件平台 等10款产品也广获关注,获评年度创新产品奖。 网易数帆基础软件平台等10款产品获年度创新产品奖 在本届软博会颁奖环节,网易数帆基础软件平台等10款产品获评年度创新产品奖。 网易数帆 是网易公司旗下数字化转型基础软件提供商,有 云原生软件生产力平台网易轻舟 、 全链路数据生产力平台网易易数 、 多媒体智能平台网易易智 、 全维度质量效能平台网易易测 四个业务方向。 网易轻舟 基于一站式云原生服务,提升企业软件研发、运营的能力和效率,打造企业数字化基础设施。网易易数为企业提供全链路数据产品和服务,帮助企业级用户快速在业务场景中应用大数据,助力业务发展和产业升级。网易易智则聚焦智能语音语言和计算机视觉等领域,在语音识别、自然语言理解、文字识别、视频分析等有丰富AI成果。网易易测为企业提供测试管理,UI自动化测试、接口自动化测试、性能压测等整体解决方案,助力企业建立健全质量效能体系。 除了在网易云音乐、网易严选、网易新闻等大量业务落地实践外,网易数帆已服务名创优品、工商银行、海亮集团

科大讯飞拾音领域实现新突破,“谛听”可识别30分贝超小音量

跟風遠走 提交于 2020-09-28 12:57:17
近年来,国内人工智能技术日新月异,但一些前端技术,却少有突破。随着A.I.智能语音等产品的流行,人们的人机交互方式逐渐从物理交互向生物交互转变。而交互的第一步——拾音,效果差强人意。就智能家居来说,它们的拾音范围多集中于近场环境,约为2-3米,且拾取效果往往欠佳,需多次唤醒。 如果把摄像机比作“眼睛”,拾音器便是“耳朵”。眼睛看到的图像和耳朵听到的声音组合构成一个基本的影音记录系统。然而这只灵活的耳朵在应用过程中会受到诸如拾音距离、室内混响、环境噪音等诸多因素的影响,这对拾音来说是不小的挑战。 如何真正“耳听八方”?深耕智能语音与人工智能领域多年的科大讯飞,近期,推出了全新拾音品牌——谛听,在超小音量拾取和降噪方面力争取得一席之地。其实,讯飞在早前推出的讯飞录音笔、智能鼠标、阿尔法蛋等产品均涉及语音交互。基于产品应用的技术积累,这次在拾音领域发力深耕,令人欣喜。 据了解,科大讯飞谛听系列配备了32路麦克风,主打全自动声源定位、自适应波束形成和混响抑制技术以及基于深度学习的噪声抑制和语音自动增益调节算法,可实现室内说话人自动定位、噪声与混响抑制、音量自动调节等功能,从而达到精准拾音的目的。 自动追踪声源,精准拾取30分贝超小音量 近日,某科技博主的一支关于拾音器的评测视频引发关注。视频中,科大讯飞的谛听系列产品和德国森海塞尔、美国舒尔的同类产品“同台竞技”,讯飞表现出彩。

现实版“镭射眼”!佩戴这款新型隐形眼镜,一个眼神搞定一切

此生再无相见时 提交于 2020-09-27 23:56:06
大数据文摘出品 来源:dailymail 编译:李雷、夏雅薇 最近,法国科学家从X战警的镭射眼身上得到灵感,研发出一种 隐形眼镜 ,可以 发射红色激光束对准佩戴者所看到的物体 。 这款眼镜的原理是在普通尺寸的隐形眼镜上装配了一个垂直腔表面激光发射器(VCSEL),用于向佩戴者观看的方向发射激光。 研究人员使用现成的零部件创建了一个可用于 凝视识别 的眼镜原型。 凝视识别是一个新兴的研究领域,可能成为人工智能的下一个前沿阵地。 凝视识别可以使人们 跨过触摸屏或鼠标来控制电子设备 ,在无需触碰屏幕或按键的情况下即可选择显示器上的选项。 这款内置红外线激光的隐形眼镜命名为“cyclops lens”(镭射眼镜),取自X战警漫画中的著名英雄“镭射眼”。 如图所示,隐形眼镜原型内部的电子设备(左)和人眼佩戴的电子设备(右)。该系统可以被看作是“一种使用红外(iR)激光嵌入式无线智能隐形眼镜的新型眼部跟踪系统” 在设计上,每只眼的隐形镜片外框都安装了 摄像系统 ,用于跟踪人的视线。 来自南斯的法国大西洋高等矿业电信学校的研究人员在一项实验中,将这款隐形眼镜 安装在可旋转的假眼 上,再将一个分束器放置在带了眼镜的假眼前,用于定位两眼分别发出的光束。 研究人员在研究报告中表示:“ 分束器镀了膜 ,可以反射两眼激光点产生的红外光束,同时又对眼睛透明,以避免不必要的反射。” 最后,

史上最强DIY,手工制作一只会说话的机器狗

好久不见. 提交于 2020-09-24 07:33:54
摘要: 波士顿动力的机器狗,想要么?快来跟我一起动手制作吧。 波士顿动力的机器狗了解吗? 一个会后空翻、会开门、会爬楼梯的AI。 最近,我们实验室就来了一批mini版的机器狗,虽然不会各种高难度杂技动作,但在我们各种捣鼓下,现在特别“能说会道”。 目标:一只具备语音交互的机器狗 当前,采用API访问云端实现诸如语音识别、语音合成模块功能,逐渐可以简化或者取代一些复杂的本地资源部署,快速实现相应的功能。 但对于一些语音交互科研机器人,语音服务经常面临本地部署设备数目少、部署成本高、维护麻烦等问题。寻求低成本、部署方便、语音合成迅速的语音交互服务模块,成为设计语音交互机器人的关键瓶颈。 这次,我们对机器狗科研Demo样机搭载语音识别ASR、自然语言处理NLP、语音合成TTS服务,从而实现准确快速的语音识别、多音色富有情感的语音合成、语音运动控制、智能提醒等功能。 针对上述要求,我们选用了华为云的语音识别ASR、语音合成TTS以及自然语言处理NLP产品。具体实验改造过程其实很简单,分为三步: 在本地设备部署语音唤醒服务,设备语音唤醒后,将录音片段通过华为云的语音识别接口传至华为云进行语音识别处理。 将华为云返回的语音识别文字信息在本地进行自然语言处理,或运用华为云的自然语言处理模块进行自然语言处理得到相应的语义、控制指令信息。 将需要语音合成的文字通过华为云的语音合成接口传至华为云

百万年薪,等您挑战!招聘认知智能天才!

偶尔善良 提交于 2020-09-23 22:56:12
第一:公司简介 杭州道翰天琼智能科技有限公司是一家认知智能科技公司。其主要方向是 认知智能理论,认知智能技术以及认知智能产品体系。用最先进的认知智能技术体系,推动技术升级,推动市场升级,产业升级,推动认知智能以及新一代智能时代的的到来。同时响应国 家2030科技计划。公司在认知智能领域已经取得多项重大突破。同时让更多业内人士共享认知智能体系 ,助力企业腾飞。欢迎顶尖认知智能人才加入! 第二:招聘职位 认知智能工程师(天才型) 第三:职位要求 1:精通古今中外哲学体系:包含但不限于易经,道德经,程朱理学,王阳明心学,存在论,本体论,认知论等哲学思想体系。 2:精通脑科学,对大脑结构,功能,机制等有深入研究,并且对宇宙,信息,大脑三者关系有深入研究。 3:精通心理学,认知发展论,结构主义,联结主义,行为主义,逻辑学,情感学,认知科学,符号学,语言学,形式语言学,认知语言学,色彩学等相关学科,并且有很强的交叉学科研究能力以及技术转化能力。 4:精通信息论,计算机科学,数学,物理学等学科。 5:精通人工智能相关体系包含但不限于机器学习,深度学习,各类算法,机器视觉,自然语言处理,语音识别,语音生成,图谱,多模态,机器人大脑等体系。 6:极强的编程能力,精通四种以上编程语言,有10年以上编程经验,主导过复杂大型高难度系统的研发。 7:有独创性开拓性突破性思想体系,包含但不限于现有人工智能

AI辅助,数据标注行业发展的新引擎丨曼孚科技

狂风中的少年 提交于 2020-08-20 08:55:55
人工智能是研究如何通过机器来模拟人类认知能力的科学,目前人工智能应用最广泛的计算机视觉与语音交互依赖于监督学习下的深度学习方式,而监督学习下的深度学习算法训练则十分依赖人工标注数据。 相关数据显示,目前一个新研发的计算机视觉算法需要上万张到数十万张不等的标注图片训练,新功能的开发需要近万张标注图片训练,而定期优化算法也有上千张图片的需求。 这些海量训练数据集的背后是无数标注员共同努力的成果,正如著名科幻作家刘慈欣所言,“现在的人工智能,前面有多少智能后面就有多少人工。” 不过,随着人工智能落地进程的加快,这种过于依赖人力的方式也暴露出很多弊端。 首先,AI商业化对数据标注行业提出了新的要求,想要更加契合落地需求、解决垂直场景具体痛点,还需要海量且优质的标注数据做支撑,这在无形中增加了数据服务供应商的管理以及人力成本。 此外,数据需求量的提升对服务商的交付能力也提出了新的要求,容易造成项目延期等连锁反应。 为了解决这些问题,通过在数据标注以及质检的环节中应用AI辅助,进行人机协作,可以有效提高标注效率,充分发挥AI对于数据标注行业的反哺作用。 1.AI预标注 在语音转写类标注项目中,数据标注员需要仔细聆听每一个词语的发音,判断并转写其语义,这对于标注员的听写能力以及在长时间多任务下的专注力有着极高要求。 通过在此环节应用AI辅助,对语音数据进行语音识别

用人工智能监督人工 遭遇非技术困局

元气小坏坏 提交于 2020-08-20 08:24:23
来源: 科技日报 远程办公常态化催生云监工软件市场。近日一款名为Enaible的AI监工软件销售火爆,这种AI软件不仅可以盯着员工干活,还可以对员工的工作效率进行打分…… 一场新冠肺炎疫情,让远程办公逐渐成为常态。钉钉、飞书、企业微信、zoom等视频会议类软件,很好地解决了远程沟通问题。除了视频会议软件,另一种云监工软件也火了,这种AI软件可以盯着你干活,看你是否“摸鱼”,并给你打分。这款AI监工软件名叫Enaible,据悉,全员在家办公期间,Enaible销售尤其火爆,前来咨询的公司数量是以前的4倍。但也有批评声音表示,这款软件会让员工失去创造力和对于公司的忠诚度。 收集操作痕迹 可给工作效率评分 AI监工有何神通能监督员工们的工作,还能为员工打分?据介绍,Enaible软件装在员工的电脑里,并可以在后台一直运行,收集员工工作中的细节数据后提供给公司。软件使用了一个名为Trigger-Task-Time的算法,算法会根据邮件或者电话,来判断员工要完成什么任务以及计算这些任务花了多长时间来完成,随后算法会根据这些数据给员工的工作效率打分。 “我们使用的操作系统,都会以日志的形式对应用软件的操作流程进行记录。打开哪个文档、内容是什么、上网浏览哪些网页都会留下使用痕迹。在计算机里面装一个监控软件,赋予它操作系统里的很多权限,AI监工就能把办公中操作电脑所留下的各种数据收集起来

互联网掀起农家乐,巨头上演AI掘金战

好久不见. 提交于 2020-08-20 07:50:40
配图来自Canva **前有网易、阿里AI养猪,后有腾讯AI养鹅,互联网大佬们纷纷玩起了“农家乐”,互联网的生意在尖端技术的引领之下频频跨界,巨头之间的较量也从线上延伸至线下。**自古“民以食为天”,缺什么都不能缺粮食,技术赋能农业生产必然会成为解决未来民生问题的重要方式,为互联网公司的发展插上新翅膀。 现代农业插上AI翅膀 我国作为农业大国,农业是最重要的经济支柱之一,人口日益增长对粮食产量和粮食安全提出了更高的要求,驱动着传统农业正在朝着数字化和智能化的方向展开创新。以人工智能为主导的农业技术已经渐渐渗透到整个生产过程,AI农业释放的强大能量将会彻底打破传统农业的僵局。 国家统计局的人口普查数据显示,目前农村青壮年劳动力流失较为严重,去年农村适龄劳动力数量仅为3.13亿人,占农村总人口的56%,远远低于城市适龄劳动人口,同时农村老龄化的水平则高于全国平均水平。 传统农业长期以来都是以人力参与为主,然而随着农村人口大量向城市迁移,农业人口的缺口和老龄化成为制约农业发展的重要因素。 AI技术的到来犹如“及时雨”,一方面依靠AI技术充分释放了劳动生产力,为农村人力缺口找到了替代方案。 另一方面AI技术也推动了农业升级转型,从粗放的农耕方式变成智慧化生产,极大提高了生产效率和产品质量,为AI技术的落地打开了新的窗口。 农业农村信息化专家咨询委员会发布的《中国数字乡村发展报告(2019)

t分布, 卡方x分布,F分布

南笙酒味 提交于 2020-08-20 00:57:47
T分布:温良宽厚 本文由“医学统计分析精粹”小编“Hiu”原创完成,文章采用知识共享Attribution-NonCommercial-NoDerivatives 4.0国际许可协议(http://creativecommons.org/licenses/by-nc-nd/4.0/)进行许可,转载署名需附带本号二维码,不可用于商业用途,不允许任何修改,任何谬误建议,请直接反馈给原作者,谢谢合作! 命名与源起 “t”,是伟大的Fisher为之取的名字。Fisher最早将这一分布命名为“Student's distribution”,并以“t”为之标记。 Student,则是William Sealy Gosset(戈塞特)的笔名。他当年在爱尔兰都柏林的一家酒厂工作,设计了一种后来被称为t检验的方法来评价酒的质量。因为行业机密,酒厂不允许他的工作内容外泄,所以当他后来将其发表到至今仍十分著名的一本杂志《Biometrika》时,就署了student的笔名。所以现在很多人知道student,知道t,却不知道Gosset。(相对而言,我们常说的正态分布,在国外更多的被称为高斯分布……高斯~泉下有知的话,说不定会打出V字手势~欧耶!) 看懂概率密度图 这一点对于初学者尤为重要,相信还是有不少人对正态分布或者t分布的曲线没有确切的理解。 首先,我们看一下频率分布直方图,histogram: