PaddlePaddle

全面支持三大主流环境 |百度PaddlePaddle新增Windows环境支持

谁说胖子不能爱 提交于 2020-03-24 19:42:51
3 月,跳不动了?>>> 引言 PaddlePaddle作为国内首个深度学习框架,最近发布了更加强大的Fluid1.2版本, 增加了对 Windows 环境的支持,全面支持了Linux、Mac、 Windows三大环境。 PaddlePaddle在功能完备的基础上,也尽量秉承易学易用的特点,在Windows的安装方面,体现了一键式的特点,大部分情况下,只需要一条简单的命令就可以完成安装。 用户在使用的过程中可能会面对安装和编译方面的问题,下面就从这两个方面来分别说明。 安装 在深度学习框架上, Python语言由于本身的易用性和丰富的类库,被众多深度学习框架作为了应用方面的首选,PaddlePaddle也将Python语言作为了自己的应用语言,如下介绍在Python下怎么安装PaddlePaddle。 1.系统检查 PaddlePaddle目前支持Windows7,8,10系列的专业和企业版本,且只支持64位的操作系统。 PaddlePaddle目前支持的Python版本覆盖了2.7,3.5,3.6,3.7版本,基本上包含了目前主流使用的所有python版本,可以通过如下方式检查操作系统和python版本情况 >>> import platform >>>platform.architecture() ( '64bit' , 'WindowsPE' ) # 64 bits on

Python 识别文本情感就这么简单

你。 提交于 2020-03-24 11:00:53
3 月,跳不动了?>>> 很多同学都对自然语言处理感兴趣,但是却不知道应该从哪里下手。Python实用宝典曾写过一篇文章(《 短文本分类识别自杀倾向 》),教你从构建数据集到训练数据,再到测试数据,整个流程确实需要耐心的人才能成功走通。 不过现在有了paddlehub,我们可以先省略掉构建数据集和训练数据这两个步骤,直接拿模型过来分类。一旦简单版的分类成功了,你就会有动力继续前进,继续学习如何训练属于自己的模型。 今天我们用paddlehub中比较简单的情感倾向分析模型 senta_lstm 来对文本做一个简单的积极和消极的分类。 1.准备 为了实现这个实验,Python是必不可少的,如果你还没有安装Python,建议阅读我们的这篇文章哦: 超详细Python安装指南 。 然后,我们需要安装paddlepaddle, 进入他们的官方网站就有详细的指引: https://www.paddlepaddle.org.cn/install/quick 根据你自己的情况选择这些选项,最后一个CUDA版本,由于本实验不需要训练数据,也不需要太大的计算量,所以直接选择CPU版本即可。选择完毕,下方会出现安装指引,不得不说,Paddlepaddle这些方面做的还是比较贴心的(就是名字起的不好)。 不过虽然它里面写了这么多,大部分人用一句话安装,打开CMD(Win+R)或者Terminal

提供免费计算资源,开发平台AI Studio零门槛实现AI能力

大憨熊 提交于 2020-03-24 07:35:31
3 月,跳不动了?>>> 2018 年 7 月 4 日-5 日,百度在国家会议中心举办第二届 AI 开发者大会。在今年的开发者大会上,百度发布了 PaddlePaddle3.0,既升级了核心框架,又提供了 EasyDL 快速应用平台、AutoDL 网络结构自动化设计,以及 AI Studio 在线实训平台。本文从功能简介,实战建模及 AI 能力应用等角度介绍了 AI Studio。 AI Studio 是百度推出的一站式开发平台:一个囊括了 AI 教程、代码环境、算法算力、数据集,并提供免费的在线云计算的一体化编程环境。用户不必纠结于复杂的环境配置和繁琐的扩展包搜寻,只要打开浏览器输入 aistudio.baidu.com,就可以在 AI Studio 开展深度学习项之旅。 据介绍,运用 AI Studio 开发者可以实现自定义的 AI 建模能力而无需考虑硬件成本、运维成本、人力成本。相比于在其他云平台上花钱买计算资源和存储空间跑模型来说,AI Studio 提供全套免费服务(计算资源免费,空间资源免费,项目托管免费,视频教程也免费)。 1. 功能简介 第一次进入主页,首先的感觉是这是个类似 Kaggle 的数据竞赛平台,但是仔细看来,AI Studio 强化了工程项目的概念,一大亮点就是 AI 学习项目这个版块,里面包括大量真实场景的工程项目(图像识别,情感分析,个性化推荐等)

快速上手百度大脑EasyDL专业版·物体检测模型(附代码)

谁说胖子不能爱 提交于 2020-03-23 19:31:52
3 月,跳不动了?>>> 作者:才能我浪费99 1. 简介: 1.1. 什么是EasyDL专业版 EasyDL专业版是EasyDL在2019年10月下旬全新推出的针对AI初学者或者AI专业工程师的企业用户及开发者推出的AI模型训练与服务平台,目前支持视觉及自然语言处理两大技术方向,内置百度海量数据训练的预训练模型,可灵活脚本调参,只需少量数据可达到优模型效果。 适用人群: 专业AI工程师且追求灵活、深度调参的企业或个人开发者 支持定制模型类型。 1.2. 支持视觉及自然语言处理两大技术方向: 视觉:支持图像分类及物体检测两类模型训练。 任务类型: 预置算法 图像分类: Resnet(50,101)、Se_Resnext(50,101)、Mobilenet Nasnet 物体检测: FasterRCNN、YoloV3、mobilenetSSD 自然语言处理:支持文本分类及短文本匹配两类模型训练,内置百度百亿级数据所训练出的预训练模型ENNIE. ERNIE(艾尼)是百度自研持续学习语义理解框架,该框架可持续学习海量数据中的知识。基于该框架的ERNIE2.0预训练模型,已累计学习10亿多知识,中英文效果全面领先,适用于各类NLP应用场景。 任务类型 :预置网络 文本分类: BOW、CNN、GRU、TextCNN、LSTM、BiLSTM 短文本匹配:SimNet(BOW、CNN、GRU

都9102年了还不懂动态图吗?一文带你了解飞桨动态图

隐身守侯 提交于 2020-03-20 02:04:33
3 月,跳不动了?>>> 导读:飞桨PaddlePaddle致力于让深度学习技术的创新与应用更简单。飞桨核心框架已提供了动态图(DyGraph)相关的API和文档,并且还附有Language model、Sentiment Classification、OCR、ResNet等模型的动态图版本官方实现。飞桨目前兼具了动态图和静态图的优势,同时具备灵活性和高效性。 飞桨动态图&静态图整体结构如下: 1. 动态图与静态图 目前深度学习框架主要有声明式编程和命令式编程两种编程方式。声明式编程,代码先描述要做的事情但不立即执行,对深度学习任务建模,需要事先定义神经网络的结构,然后再执行整个图结构,这一般称为静态图模式。而命令式编程对应的动态图模式,代码直接返回运算的结果,神经网络结构的定义和执行同步。通常来说,静态图模式能够对整体性做编译优化,更有利于性能的提升,而动态图则非常便于用户对程序进行调试。 2. 飞桨动态图的三大特色 飞桨的DyGraph模式是一种动态的图执行机制。与静态计算图的执行机制不同,DyGraph模式下的操作可以立即获得执行结果,而不必等待计算图全部构建完成。这样可以让开发者更加直观地构建深度学习任务并进行模型的调试,同时还减少了大量用于构建静态计算图的代码,使得编写、调试网络的过程变得非常便捷。 飞桨DyGraph动态图模式,主要有三大特色: 灵活便捷的代码书写方式

性能领先,即训即用,快速部署,飞桨首次揭秘服务器端推理库

烂漫一生 提交于 2020-03-18 18:54:45
3 月,跳不动了?>>> 假如问在深度学习实践中,最难的部分是什么?猜测80%的开发者都会说: “当然是调参啊。” 为什么难呢?因为调参就像厨师根据食材找到了料理配方,药剂师根据药材找到了药方,充满了玄幻色彩。 但是, 掌握了调参,顶多算深度学习的绝学掌握了一半。而另一半就是“模型部署”。 模型部署有什么难的?举个例子:前面这位大厨在培训学校,经过各种训练掌握了很多料理配方,终于要到酒店上任了,却发现酒店的厨房环境和训练时不一样,就餐高峰时手忙脚乱,客户等了1个小时还没上菜,结果第一天上岗就被投诉了。 虽然比喻略有夸张,却也道出了深度学习模型训练和推理部署的关系。 我们知道,深度学习一般分为训练和推理两个部分,训练是神经网络“学习”的过程,主要关注如何搜索和求解模型参数,发现训练数据中的规律。 有了训练好的模型之后,就要在线上环境中应用模型,实现对未知数据做出预测,这个过程在AI领域叫做推理。 在实际应用中,推理阶段可能会面临和训练时完全不一样的硬件环境,当然也对应着不一样的计算性能要求。我们训练得到的模型,需要能在具体生产环境中正确、高效地实现推理功能,完成上线部署。 所以,当我们千辛万苦训练好模型,终于要上线了,但这个时候可能会遇到各种问题,比如: 线上部署的硬件环境和训练时不同 推理计算耗时太高, 可能造成服务不可用 模型上的内存占用过高无法上线 对工业级部署而言

2020语言与智能技术竞赛启动,百度提供最大规模中文数据集

こ雲淡風輕ζ 提交于 2020-03-13 05:45:20
语言是传递人类信息最重要的媒介,让机器理解语言并使用语言进行交互是实现通用人工智能的重要挑战。3月10日,2020语言与智能技术竞赛正式启动,面向全球开发者开启报名通道。 本届竞赛由中国中文信息学会(CIPS)和中国计算机学会(CCF)联合主办,百度公司、中国中文信息学会评测工作委员会和中国计算机学会中文信息技术专委会联合承办,并将在第五届“语言与智能高峰论坛”举办技术交流和颁奖,获胜团队将分享总额35万人民币的奖金。届时,国内外学术界、工业界知名专家学者,也将面向社会公众介绍国内外语言与智能及相关领域的发展趋势和创新成果。 本次竞赛共设立五个任务,包括机器阅读理解、面向推荐的对话、语义解析、关系抽取和事件抽取,涉及到语言理解、人机对话、知识抽取等复杂技术。研究上述任务对于智能搜索、智能推荐、智能交互等人工智能应用具有重要意义,是自然语言处理和人工智能领域的重要前沿课题。 本次竞赛的五个任务都将提供百度大规模中文数据集,为研究者提供学术交流平台,推动语言理解、人工智能领域技术研究和应用的发展。 01 三大经典任务全面升级,覆盖更多真实应用场景 本次竞赛中,机器阅读理解、面向推荐的对话、关系抽取三大经典任务在2019年的基础上做了全面升级。机器阅读理解是指让机器阅读文本,然后回答和阅读内容相关的问题。与2019年相比,今年的阅读理解任务,将重点关注阅读理解模型在真实应用场景中的鲁棒性

飞桨博士会第六期回顾|新时代AI课程与飞桨设计思想

和自甴很熟 提交于 2020-03-12 02:01:35
飞桨博士会第六期沙龙于11月30日在百度大厦举办,来自深度学习研究方向的博士齐聚西二旗进行交流。 本次沙龙首次特邀两位主讲嘉宾,百度深度学习技术平台部两位主任架构师——毕然和胡晓光,分别详解新时代AI课程、飞桨设计思想与编程指南。如下呈现本场主讲内容摘要,可供回顾参考。 01 新时代AI课程:机器学习的思考故事&零基础入门深度学习 毕然老师从“机器学习模型演进路线”和“从模型到系统到商业”两个部分对《机器学习的思考故事》课程进行概述。 机器学习模型演进路线可从框架拆解、学习理论、复杂模型和实用技巧四方面理解。毕然老师从机器学习的基本理论引入,进而延伸讲解如何构造非常强大的模型。机器执行学习时,需要圈定假设空间(包含不同参数之间的关系),并借助评价指标判断参数在不同取值中,哪一个情况下与真实情况接近。同时,毕然老师在这门课程中重点阐述具体算法在设计中更本质的原理。 在“从模型到系统到商业”部分,毕然老师首先提出观点,即模型建立要基于对整个系统非常深度的理解,而系统如果要成为长久的生意则需要满足市场需求,并且有合理的商业逻辑。机器学习的模型都需要嵌入进某个系统中,而这个系统目标是实现某个商业业务。这里毕然老师以百度图像搜索应用为例,由实际用户需求场景切入到技术思路,并和现场博士们就技术实现是采用分类模型还是检索模型讨论。 《零基础入门深度学习》从课程设计思想、学习平台进行介绍

不认得各种中药材?来看看飞桨开发者的妙招

旧城冷巷雨未停 提交于 2020-03-11 16:17:08
【飞桨开发者说】韩爱庆 北京中医药大学管理学院 副教授 中药是中医临床治疗的主要载体、也是中医药文化最核心的载体,蕴含着大量的科技资源、文化资源、产业资源。据相关报道,我国是全球最大的中药材市场。数据显示,2019年预计我国中成药及饮片市场规模达到6800亿元,未来5年将达到2万亿元,可见中药材庞大的市场价值。由于中药材的真伪、优劣与临床用药的安全有效有直接关联,因此对中药材进行客观、科学的鉴定识别,有利于规范中药材市场,加强质量监控,促进中药材产业的发展。 很多学者对应用客观指标来进行中药材的鉴定识别进行了广泛的研究,相关研究所采用的方法包括近红外光谱、指纹图谱、电子鼻以及化学模式识别,或者采用多方法相结合来开展研究。这些方法的共同特征是需要基于专家经验或先验知识来人工设计或提取特征,前期的特征提取工作量特别大,得到的模型在训练集上准确率虽然高,但在测试集上普遍存在泛化能力差的情况;另外使用这些方法来进行中药识别需要专用设备,便利性较差,应用门槛高,不利于推广应用。因此,开发一款能够自动提取特征,并能够使用通用终端设备进行识别,准确率高,泛化性能好的中药识别系统是行业的迫切需求。 近年来,以深度学习为代表的人工智能技术飞速发展。与以往不同的是,这次人工智能不仅在学术界备受关注,在工业界也备受推崇。以“深度学习”为关键词搜索国家自然科学金委近年资助项目,发现基金委资助和立项的

飞浆集训营小结

与世无争的帅哥 提交于 2020-03-10 18:58:05
19年开始决定认认真真的学习飞浆,并且把飞浆作为自己未来五年职业生涯的核心。在明确了目标以后,就要行动起来,并且要做到坚持不懈、周而复始。 在参加集训营之前,一遍遍的看飞浆官方文档是我学习飞浆的主要方法。其次就是复现官方案例,尽量让自己读懂、熟悉每一行代码。学习官方文档可以让我系统的了解飞浆,并且可以在我有疑问的时来这里找到答案。不到一个月的时间,我就可以使用飞浆跑一些经典的案例。 看文档总归会有一些枯燥,时间长了会让学习的激情消减。然而我遇到的最可怕的问题是理解的内容与实际应用产生了偏差。比如fluid.data中对shape参数的理解,不同的案例会有不同的解释,这一度让我很困惑。 拨开云雾见青天,参加集训营让我一步步靠近飞浆,对飞浆有了越来越深刻的理解。下面我总结一下集训营给了我哪些帮助: 激励 参加本次集训营正好是疫情期间,在家办公的效率本不是太高。但是集训营通过每天发布任务、打榜有奖励的形式,给我营造了一种紧张氛围。让我想不到的是有两天我竟然早上七点半就起来开始跑模型了。 实践 实践出真知。集训营期间为了提高模型效果,绞尽脑汁的去做各种尝试,也许经验不足,但是主动努力的过程是深刻的。比如一张shape为(32, 32, 3)的彩色图片,在PaddlePaddle中使用需要把通道放在最前面,即转换为(3, 32, 32),用reshape还是transpose来转化呢?