语音识别

4412开发板图像识别项目-初识人工智能(一)

大城市里の小女人 提交于 2020-08-15 23:51:34
一.什么是智能?什么又是人工智能? 智能通俗来说就是拥有听,说,读,写,思考,情感的生物,而人工智能,顾名思义就是由人创造的,同样具备听(语音识别),说(语音合成),读(文字识别),写(图像识别),思考(逻辑处理)等等。 二.我们身边的人工智能又有那些呢? 比如刷脸支付,违章拍照,小米的小爱同学,苹果的siri,华为的小艺,等等这些都是人工智能的应用。 三,目前人工智能可以做什么? 图像识别:违章拍照,智能道闸等等 视频识别:内容鉴定等 文字识别:提取信息等 语音识别,语音合成:小爱同学等 等等。。。 四,百度AI是什么? 目前市面上主流的AI技术提供公司有很多,比如百度,阿里,腾讯,主做语音的科大讯飞,做只能问答的图灵机器人等等,这些公司投入了很大一部分财力物力人力将底层封装,提供应用接口给我们,尤其是百度,完全免费的接口,我们可以利用这些接口,不用关心底层算法,快速进入人工智能这个行业,所以接下来,我们就开启人工智能之旅。 五,开通百度AI授权 1. 首先进入控制台,注册一个百度的账号,如果已经有了百度账号可以直接使用。 2.登录成功后,在左边菜单栏找到自己要使用的服务,这里以文字识别为例。 3.在文字识别管理里面新建一个应用服务,点击创建应用。 4,填写应用信息。 应用名称:任意 应用类型:这里随便选择,暂时选择学习办公 接口选择:默认勾选了语音识别和语音合成。保持默认即可

订单少落地难:被误解的人工智能

被刻印的时光 ゝ 提交于 2020-08-15 18:33:29
云栖号资讯:【 点击查看更多行业资讯 】 在这里您可以找到不同行业的第一手的上云资讯,还在等什么,快来! 文 | 特约观察员 顾夏辉 安涛 编辑 | 刘子晴 人工智能落地现状 2020年人工智能依然是一个非常热的话题。中美的科技巨头以及很多跨国企业都把人工智能作为其战略发展的重要布局,国家层面也出台政策重点发展人工智能产业。2019年,中国人工智能专利申请量排行世界第一,累计申请量44万余件,中国已超过美国成为人工智能领域专利申请量最高的国家。 但是与公众关注和各方支持的力度相比,人工智能技术的落地速度并没有达到人们的预期。目前人工智能集中于新零售、智能制造、智慧农业、医疗健康、智慧城市、营销和教育等产业,超过50%的赋能实体为安防。预计到2022年,人工智能赋能实体经济仅能达1600亿。对于40万亿的市场而言,人工智能还远远没有落地。 如何才能加快人工智能的落地速度?在这个问题之前,首先要明确人工智能技术是否重要、重要到什么程度。 人工智能带给我们的是什么? 一句话,科技带给人类发展的核心是对资源的优化。 蒸汽机的出现,使机器代替了手工劳动,一部分人从重复劳动解放出来,转为管理、运营和科研工作;电力的出现,推动企业间竞争的加剧,促进生产和资本的集中,产生了垄断;互联网的出现,使得人们节省大量获得信息的资源,整合企业的管理和策略工作。 如果人类想继续进行对资源和成本优化

人工智能发展70年 高速增长如今才刚要开始

↘锁芯ラ 提交于 2020-08-15 12:15:30
截至2019年底,我国人工智能核心产业的规模超过510亿元,人工智能企业超过2600家。与此同时,AI+制造、交通、商圈、文旅、政务、园区、金融等一批应用场景也在全力打造中。不少人工智能企业正紧抓“AI+新型基建”的契机展开卡位赛。我国逐步走出了一条由需求导向引领商业模式创新、市场应用倒逼基础理论和关键技术创新的发展路径。 几年前还经常存在于新闻或者故事中的人工智能技术,现如今已普遍走进的我们的生产生活中,比如手机中的智能语音助手、解锁时的人脸识别等。 在今年突发新冠肺炎疫情期间,人工智能技术在抗疫过程中发挥着重要作用,产业发展明显提速。人工智能测温结合人脸检测和红外热成像技术,通过精确定位人脸满足“大规模人群”的远距离测温,实现快速、大面积安全排查,提升效率、节约人力的同时还大大降低一线工作人员被感染的风险;智能机器人承担部分预诊、巡房、递送、消毒等大量简单却又耗力的流程化工作,减少医护人员工作量、降低医患交叉感染风险,同时也节约了医疗资源;肺炎诊断人工智能系统平台能够快速响应并给出诊断报告,帮助医生更快排查筛选“高度疑似肺炎患者”,减少患者的排队时间和院内交叉感染的风险;“智能语音外呼平台”帮助基层社区开展疫情排查等工作。一对一电话呼叫、收集信息、形成报告,一小时最多可外呼5000个以上的电 号 ,效率超人工1000倍;科技公司向科学家开放AI算法资源,大大提升了病毒分析

TensorFlow非常出色的30个机器学习数据集

拟墨画扇 提交于 2020-08-15 12:14:15
本文转自雷锋网,如需转载请至雷锋网官网申请授权。 TensorFlow是由谷歌大脑的研究人员创建、最大的机器学习和数据科学的开源数据库之一。它是一个端到端平台,适合完全没有经验的初学者和有经验的数据科学家。TensorFlow库包括工具、预训练模型、机器学习教程以及一整套公开数据集。为了帮助你找到所需的训练数据,本文将简单介绍一些TensorFlow中用于机器学习的大型数据集。我们将以下数据集的列表分为图像、视频、音频和文本。 TensorFlow图像数据集 CelebA:明星脸属性数据集(CelebA)是最大的公开可用的人脸图像数据集,其中包含200,000多个名人图像。 每个图像包括5个面部标注和40个二进制属性标注。 Downsampling Imagenet:该数据集是为密度估计和生成性建模任务而建立的。它包括了130多万张物体、场景、车辆、人物等图像。这些图像有两种分辨率规格:32×32和64×64。 Lsun—Lsun是一个大规模的图像数据集,创建该数据集是为了帮助训练模型进行场景理解。该数据集包含超过900万张图像,按场景类别划分,如卧室、教室和餐厅。 Bigearthnet—Bigearthnet是另一个大规模数据集,它包含来自Sentinel-2卫星的航空图像。每张图像覆盖了1.2公里×1.2公里的一片地面。该数据集中有43个类别不平衡的标签。 Places

Android | 教你如何快速集成机器学习能力

我只是一个虾纸丫 提交于 2020-08-15 07:22:51
背景   继上篇博文说了如何快速集成扫码以后 我又上官网去了解了一下其他的功能,其中机器学习服务是当下比较火的,而且还是免费的。就赶紧点进去学习一下。看看能够快速实现哪些功能。 链接在这里: https://developer.huawei.com/consumer/cn/doc/development/HMS-Examples/ml-samplecode-4 华为HMS机器学习服务代码下载链接: https://developer.huawei.com/consumer/cn/doc/development/HMS-Guides/ml-introduction-4   注意:上面链接中的代码无法直接被调用,需要配对应的agconnect-services.json才可以使用。为了方便起见,我将我账号的注册的json文件共享出来,下面会有哦~ 能力介绍   里面分为人脸识别,图像分割,文本检测,翻译,目标检测,物体识别,地标识别,语音识别,好像在接下来还会推出拍照购物,姿势检测等一系列新功能。 构建工程   安卓装机等前期步骤详细可以参开我的上一篇博文android 超简单集成快速扫码: https://blog.csdn.net/weixin_38132951/article/details/104797443 1 配置校验   在上一篇中,由于扫码是纯端侧的服务

【NLP_Stanford课堂】最小编辑距离

旧巷老猫 提交于 2020-08-15 05:10:26
一、什么是最小编辑距离 最小编辑距离 :是用以衡量两个字符串之间的相似度,是两个字符串之间的最小操作数,即从一个字符转换成另一个字符所需要的操作数,包括插入、删除和置换。 每个操作数的cost : 每个操作数的cost一般是1 如果置换的cost是2,而插入和删除的cost是1,我们称之为Levenshtein 距离。 作用 : 计算衡量机器翻译和语音识别的好坏:将机器得到的字符串与专家写的字符串比较最小编辑距离,以一个单词为一个单位。 命名实体识别和链接:比如通过计算最小编辑距离,可以判定IBM.Inc和IBN非常相似,只有一个单词不同,所以认为这是指向同一个命名实体。 二、如何找到最小编辑距离 实质 :寻找一条从“开始字符串”到“最终字符串”的路径(一个操作序列) 具体过程 : 初始状态:机器翻译出来的单词 操作:插入、删除、置换 黄金状态:我们尽力希望得到的单词 路径花费:操作数目,要求最小化 实例: 单词intention通过删除i可以得到ntention,通过插入e可以得到eintention,通过将i换成e可以得到entention。以上从intention到叶子节点的任意一个单词经过的操作数就是一条路径。 可以发现枚举出所有可转变成的单词的花费是十分巨大的,我们不可能用枚举遍历的方式来寻找一条最短路径,一种解决方法是:使用剪枝 每层中有很多路径被剪枝了,

AI正以怎样的方式影响网红营销?

烈酒焚心 提交于 2020-08-15 01:42:10
云栖号资讯:【 点击查看更多行业资讯 】 在这里您可以找到不同行业的第一手的上云资讯,还在等什么,快来! 专业美妆博主在社交媒体上向观众们传授化妆技巧 2017年10月,在剑桥分析丑闻曝出的不久之后,Facebook公司调整了其Instagram API,保证用户更难以搜索应用背后庞大的照片数据库。虽然看似寻常,但此举却给数字营销行业带来了重大影响。 不久之前,总部位于纽约的网红营销机构Amra & Elma开发出一套平台,可从Instagram中直接提取数据,并允许客户使用AI图像分类器找到特定网红用户。例如,他们可以随时找到拥有10000到50000粉、而且在最近曾在照片中拍到Jeep车型的网红。Facebook的调整让这项功能彻底失效,而这场由AI主导的资讯对抗正逐渐成为新的常态。 分析就是一切 曾几何时,成功的广告源自艺术创造力与雄厚财力的组合。要想雇用一家热门机构制作30秒长的广告,企业需要为此投入大量的资金,而成功的宣传反过来又能造成全民性质的轰动。 但互联网的诞生改变了这一切。如今,一切都以数据、分析及算法为核心。凭借着简单的adspend广告位竞拍机制,谷歌与Facebook已经通过广告宣传赚得盆满钵满。而在Google Ads当中,只有消费者点击广告内容时客户才需要向谷歌付费。至于Facebook方面,社交巨头能帮助客户将广告投放至更有针对性的人群

t分布, 卡方x分布,F分布

耗尽温柔 提交于 2020-08-14 23:00:47
T分布:温良宽厚 本文由“医学统计分析精粹”小编“Hiu”原创完成,文章采用知识共享Attribution-NonCommercial-NoDerivatives 4.0国际许可协议(http://creativecommons.org/licenses/by-nc-nd/4.0/)进行许可,转载署名需附带本号二维码,不可用于商业用途,不允许任何修改,任何谬误建议,请直接反馈给原作者,谢谢合作! 命名与源起 “t”,是伟大的Fisher为之取的名字。Fisher最早将这一分布命名为“Student's distribution”,并以“t”为之标记。 Student,则是William Sealy Gosset(戈塞特)的笔名。他当年在爱尔兰都柏林的一家酒厂工作,设计了一种后来被称为t检验的方法来评价酒的质量。因为行业机密,酒厂不允许他的工作内容外泄,所以当他后来将其发表到至今仍十分著名的一本杂志《Biometrika》时,就署了student的笔名。所以现在很多人知道student,知道t,却不知道Gosset。(相对而言,我们常说的正态分布,在国外更多的被称为高斯分布……高斯~泉下有知的话,说不定会打出V字手势~欧耶!) 看懂概率密度图 这一点对于初学者尤为重要,相信还是有不少人对正态分布或者t分布的曲线没有确切的理解。 首先,我们看一下频率分布直方图,histogram:

测试过降噪能力最强的离线语音模块

只愿长相守 提交于 2020-08-14 16:18:00
公司分派一个项目给我,让做一款离线语音晾衣架,第一时间在市场上找了几款离线模块,测试的结果是: 1、在安静环境下灵敏度好的模块,降噪能力就很差,稍微有点噪音就不行。 2、有些模块在普通话带地方口音的测试情况下识别度不也,这种模块主要是录音采样训练的,标准普通话可以用。 3、在噪音大(+75dB)的环境下,人在3米的距离的情况下,识别率非常低。 4、 模块的语音效果都要回来的调整,效果还是差强人意。 经过接近半年的来回测试,老板天天都在催,人都快逼疯了,在绝望的时候,有一次在跟朋友在聊天的过程中吐槽这个事,他给我介绍了一款双麦的离线语音模块,我拿到这款模块马上进行测试,结果是: 1、这款模块的信噪比非常好,达到惊人的-5dB,之前测试的模块基本上都在+3dB到+5dB,-5dB的信噪比导致的结果是,在+75dB的环境下,人在3米的环境下,正常喊命令就控制 2、能识别国内的很大一部分方言,公司的四川兄弟、湖南兄弟、湖北小姐姐、东北大姐用他们的家乡话测试都能通过。 3、旁边播放很大声的音乐也可以正常识别。 4、意外的惊喜的是这个模块对数字的识别特精准。 写到最后附上项目的测试视频 离线语音晾衣架视频 https://v.qq.com/x/page/s3134di3v7b.html 离线语音识别晾衣架 来源: oschina 链接: https://my.oschina.net/u

自然语言处理十大应用

守給你的承諾、 提交于 2020-08-14 13:32:33
作者|ABHISHEK SHARMA 编译|VK 来源|Analytics Vidhya 介绍 自然语言处理是数据科学领域最热门的课题之一。公司在这一领域投入大量资金进行研究。每个人都在努力了解自然语言处理及其应用,并以此为生。 你知道为什么吗? 因为仅仅在短短几年的时间里,自然语言处理已经发展成为一种无人能想象的强大而有影响力的东西。 为了了解自然语言处理的力量及其对我们生活的影响,我们需要看看它的应用。因此,我列出了自然语言处理的十大应用。 那么,让我们从自然语言处理的第一个应用开始。 搜索自动更正和自动完成 每当你在谷歌上搜索某个东西,在输入2-3个字母后,它会显示可能的搜索词。或者,如果你搜索一些有错别字的东西,它会更正它们,仍然会找到适合你的相关结果。是不是很神奇? 它是每个人每天都在使用的东西,但从来没有太多的关注它。这是自然语言处理的一个很好的应用,也是一个很好的例子。它影响世界上数百万人,包括你和我。 搜索自动完成和自动更正都有助于我们更有效地找到准确的结果。现在,其他许多公司也开始在他们的网站上使用这个功能,比如Facebook和Quora。 搜索自动完成和自动更正背后的驱动引擎是语言模型。 语言翻译 你有没有用谷歌翻译来找出不同语言中的某个词或短语?它将一段文字用一种语言翻译成另一种语言的容易程度是相当惊人的,对吧?它背后的技术是机器翻译。