机器学习

SCI-HUB文献下载工具

戏子无情 提交于 2021-02-13 11:52:41
在科研学习的过程中,我们难免需要查询相关的文献资料,而想必很多小伙伴都知道SCI-HUB,此乃一大神器,它可以帮助我们搜索相关论文并下载其原文。可以说,SCI-HUB造福了众多科研人员,用起来也是“美滋滋”。 用Python封装了SCI-HUB图形操作界面非常简洁,如图: 接下来是使用方式: 第一种方法是单篇文献下载 ,你可以输入论文的题目在第一个框框中,然后选择一个保存的目录,点击开始按钮注入灵魂,等待进度条跑满,文献就下载下来了,是不是很 so easy呢 第二种使用方法是批量下载 ,可以把需要下载的文献题目写在一个txt文件中去,比如这样: RUN一下注入灵魂吧! 提供的两种下载方法应该总有您喜欢的吧哈哈(虽然可能有小伙伴想用doi下载哈哈) 最后附上程序的网盘链接地址,已经封装成.exe可执行文件(Windows平台)欢迎大家使用,希望对大家得科研工作有帮助。下次再会! 链接地址: 链接:https://pan.baidu.com/s/1EJ2oQ8pDSl7eb-FM88TeDA 提取码:6666 数据处理·机器学习·可视化 行业资讯·学习资料 长按关注不迷路 本文分享自微信公众号 - 好奇心Log(Curiosity-log)。 如有侵权,请联系 support@oschina.cn 删除。 本文参与“ OSC源创计划 ”,欢迎正在阅读的你也加入,一起分享。 来源:

刘智攀顶刊综述:机器学习在多相催化中的应用——现状与未来

萝らか妹 提交于 2021-02-13 09:28:18
声明: 仅代表推文作者个人观点,作者水平有限,如有不科学之处,请大家指正! 原文链接: https://pubs.acs.org/doi/abs/10.1021/acscatal.0c03472 本文分享自微信公众号 - 量子化学(quantumchemistry)。 如有侵权,请联系 support@oschina.cn 删除。 本文参与“ OSC源创计划 ”,欢迎正在阅读的你也加入,一起分享。 来源: oschina 链接: https://my.oschina.net/u/4589508/blog/4819289

目标检测算法之SSD代码解析(万字长文超详细)

耗尽温柔 提交于 2021-02-13 08:50:03
前言 前面的推文已经介绍过SSD算法,我觉得原理说的还算清楚了,但是一个算法不深入到代码去理解是完全不够的。因此本篇文章是在上篇SSD算法原理解析的基础上做的代码解析,解析SSD算法原理的推文的地址如下:https://mp.weixin.qq.com/s/lXqobT45S1wz-evc7KO5DA。今天要解析的SSD源码来自于github一个非常火的Pytorch实现,已经有3K+星,地址为:https://github.com/amdegroot/ssd.pytorch/ 网络结构 为了比较好的对应SSD的结构来看代码,我们首先放出SSD的网络结构,如下图所示: 可以看到原始的SSD网络是以VGG-16作Backbone(骨干网络)的。为了更加清晰看到相比于VGG16,SSD的网络使用了哪些变化,知乎上的一个帖子做了一个非常清晰的图,这里借用一下,原图地址为:https://zhuanlan.zhihu.com/p/79854543 。带有特征图维度信息的更清晰的骨干网络和VGG16的对比图如下: 源码解析 OK,现在我们就要开始从源码剖析SSD了 。主要弄清楚三个方面,网络结构的搭建,Anchor还有损失函数,就算是理解这个源码了。 网络搭建 从上面的图中我们可以清晰的看到在以VGG16做骨干网络时,在conv5后丢弃了CGG16中的全连接层改为了 和 的卷积层。其中

顶刊综述 | mNGS的临床应用与挑战

北城以北 提交于 2021-02-13 08:48:17
如果说宏基因组学是大家关注的焦点,那么mNGS应该是宏基因组学焦点中的NO.1,尤其是在新冠疫情的大环境下。 mNGS在临床中的实际应用如何?在临床实验室中又面临着怎样的挑战?... 这些问题的答案都在今天分享的这篇综述中。2020年6月,来自美国的研究人员在《 Nature Reviews Genetics 》杂志(IF=33.133)发表了关于mNGS的综述, 回顾了mNGS在临床和公共卫生环境中的各种应用, 讨论了在临床实验室中采用mNGS所面临的挑战,并提出了克服这些挑战的步骤。同时展望了mNGS在临床领域的未来发展方向。 临床微生物学:从传统技术到mNGS 临床微生物学领域包括诊断微生物学、从临床样本中识别病原体以指导感染患者的管理和治疗策略、公共卫生微生物学以及社区监测和监测传染病暴发等。微生物的传统诊断技术包括:培养物中微生物的生长和分离,病原体特异性抗体(血清学)或抗原的检测以及微生物核酸(DNA或RNA)的分子鉴定,通常是通过PCR进行的。 尽管大多数分子分析使用特定的引物或探针仅靶向有限的病原体,但宏基因组学方法可表征样品中存在的所有DNA或RNA,从而能够分析患者样品中的整个微生物组以及人类宿主基因组或转录组。 宏基因组学方法已经应用了数十年,以表征各种生态位,从海洋环境到有毒土壤到节肢动物疾病载体再到人类微生物组。 mNGS是对患者样品中微生物和宿主遗传物质

外媒称苹果下周二或再开发布会;天津立法禁止采集人脸识别信息;360安全浏览器悄然下架会员版本 | EA周报

霸气de小男生 提交于 2021-02-13 07:44:11
EA周报 2020年12月4日 每 个星期7分钟,元宝带你喝一杯IT人的浓缩咖啡,了解天下事、掌握IT核心技术。 周报看点 1、 我国科学家构建76个光子量子计算原型机“九章” 2、 外媒:苹果下周二有望再次召开发布会 3、 收费引发争议,360安全浏览器悄然下架 VIP 会员版本 4、 腾讯成立云计算西安分公司,将成总部之外最大云研发中心 5、 英特尔旗下业务与 AWS 签约:开始夺取英伟达市场 6、 字节跳动回应拿下域名「douyinpay.com」:防止第三方恶意侵权 7、 Win 10 原生运行安卓 App:开发者几乎不需要修改代码 热点大事件 我国科学家构建76个光子量子计算原型机“九章” 中国科学技术大学潘建伟、陆朝阳等组成的研究团队,与中科院上海微系统所、国家并行计算机工程技术研究中心合作,构建了76个光子的量子计算原型机“九章”,实现了具有实用前景的“高斯玻色取样”任务的快速求解。该量子计算系统处理高斯玻色取样的速度比目前最快的超级计算机快100万亿倍。这一成果使得我国成功达到了量子计算研究的第一个里程碑:量子计算优越性(国外称“量子霸权”)。(科技日报) 罗永浩关联直播交易案遭“问停”,尚纬股份终止跨界收购直播公司 12月3日晚间,尚纬股份表示终止收购直播公司星空野望。对于此次收购终止的原因,公司表示因考虑到直播新规实施将会对直播行业产生较大影响等,公司对估值定价

目标检测算法之SSD代码解析(万字长文超详细)

≡放荡痞女 提交于 2021-02-13 01:43:04
前言 前面的推文已经介绍过SSD算法,我觉得原理说的还算清楚了,但是一个算法不深入到代码去理解是完全不够的。因此本篇文章是在上篇SSD算法原理解析的基础上做的代码解析,解析SSD算法原理的推文的地址如下:https://mp.weixin.qq.com/s/lXqobT45S1wz-evc7KO5DA。今天要解析的SSD源码来自于github一个非常火的Pytorch实现,已经有3K+星,地址为:https://github.com/amdegroot/ssd.pytorch/ 网络结构 为了比较好的对应SSD的结构来看代码,我们首先放出SSD的网络结构,如下图所示: 可以看到原始的SSD网络是以VGG-16作Backbone(骨干网络)的。为了更加清晰看到相比于VGG16,SSD的网络使用了哪些变化,知乎上的一个帖子做了一个非常清晰的图,这里借用一下,原图地址为:https://zhuanlan.zhihu.com/p/79854543 。带有特征图维度信息的更清晰的骨干网络和VGG16的对比图如下: 源码解析 OK,现在我们就要开始从源码剖析SSD了 。主要弄清楚三个方面,网络结构的搭建,Anchor还有损失函数,就算是理解这个源码了。 网络搭建 从上面的图中我们可以清晰的看到在以VGG16做骨干网络时,在conv5后丢弃了CGG16中的全连接层改为了 和 的卷积层。其中

Python: sklearn库——数据预处理

假如想象 提交于 2021-02-12 22:42:36
Python: sklearn库 —— 数据预处理 数据集转换之预处理数据: 将输入的数据转化成机器学习算法可以使用的数据。包含特征提取和标准化。 原因:数据集的标准化(服从均值为0方差为1的标准正态分布(高斯分布))是大多数机器学习算法的常见要求。 如果原始数据不服从高斯分布,在预测时表现可能不好。在实践中,我们经常进行标准化(z-score 特征减去均值/标准差)。 一、标准化(Z-Score),或者去除均值和方差缩放 公式为:(X-mean)/std 计算时对每个属性/每列分别进行。 将数据按期属性(按列进行)减去其均值,并处以其方差。得到的结果是,对于每个属性/每列来说所有数据都聚集在0附近,方差为1。 实现时,有两种不同的方式: 使用sklearn.preprocessing.scale()函数,可以直接将给定数据进行标准化。 >>> from sklearn import preprocessing >>> import numpy as np >>> X = np.array([[ 1., -1., 2 .], ... [ 2 ., 0., 0.], ... [ 0., 1., -1 .]]) >>> X_scaled = preprocessing.scale(X) >>> X_scaled array([[ 0. ..., -1.22..., 1.33 ...],

清华大学王奕森:Adversarial Machine Learning: Attack and D

倖福魔咒の 提交于 2021-02-12 21:28:29
本文作者:HelloDeveloper 嗨,大家好。这里是学术报告专栏,读芯术小编不定期挑选并亲自跑会,为大家奉献科技领域最优秀的学术报告,为同学们记录报告干货,并想方设法搞到一手的PPT和现场视频——足够干货,足够新鲜!话不多说,快快看过来,希望这些优秀的青年学者、专家杰青的学术报告 ,能让您在业余时间的知识阅读更有价值。 人工智能论坛如今浩如烟海,有硬货、有干货的讲座却百里挑一。“AI未来说·青年学术论坛”系列讲座由中国科学院大学主办,百度全力支持,读芯术作为合作自媒体。承办单位为中国科学院大学学生会,协办单位为中国科学院计算所研究生会、网络中心研究生会、人工智能学院学生会、化学工程学院学生会、公共政策与管理学院学生会、微电子学院学生会。“AI未来说·青年学术论坛”第六期“机器学习”专场已于2019年6月23日下午在中科院举行。清华大学王奕森为大家带来报告《Adversarial MachineLearning: Attack and Defence》。 Yisen Wang obtained his Ph.D. degree from the Department of Computer Science and Technology at Tsinghua University. He is also a visiting scholar at Georgia Tech

推荐 :数据分析思维和方法—用户画像分析

萝らか妹 提交于 2021-02-12 11:58:03
01 写在前面 我们经常在淘宝上购物, 作为淘宝方, 他们肯定想知道他的使用用户是什么样的, 是什么样的年龄性别, 城市, 收入, 他的购物品牌偏好, 购物类型, 平时的活跃程度是什么样的, 这样的一个用户描述就是用户画像分析 无论是产品策划还是产品运营, 前者是如何去策划一个好的功能, 去获得用户最大的可见的价值以及隐形的价值, 必须的价值以及增值的价值, 那么了解用户, 去做用户画像分析, 会成为数据分析去帮助产品做做更好的产品设计重要的一个环节。 那么作为产品运营, 比如要针用户的拉新, 挽留, 付费, 裂变等等的运营, 用户画像分析可以帮助产品运营去找到他们的潜在的用户, 从而用各种运营的手段去触达。 因为当我们知道我们的群体的是什么样的一群人的时候, 潜在的用户也是这样的类似的一群人, 这样才可以做最精准的拉新, 提高我们的ROI 在真正的工作中, 用户画像分析是一个重要的数据分析手段去帮助产品功能迭代, 帮助产品运营做用户增长。 总的来说, 用户画像分析就是基于大量的数据, 建立用户的属性标签体系, 同时利用这种属性标签体系去描述用户 02 用户画像的作用 像上面描述的那样, 用户画像的作用主要有以下几个方面 1.广告投放 在做用户增长的例子中, 我们需要在外部的一些渠道上进行广告投放, 对可能的潜在用户进行拉新, 比如B站在抖音上投广告 我们在选择平台进行投放的时候,

kNN算法基本原理与Python代码实践

。_饼干妹妹 提交于 2021-02-12 11:29:34
 kNN是一种常见的监督学习方法。工作机制简单:给定测试样本,基于某种距离度量找出训练集中与其最靠近的k各训练样本,然后基于这k个“邻居”的信息来进行预测,通常,在分类任务中可使用“投票法”,即选择这k个样本中出现最多的类别标记作为预测结果;在回归任务中可以使用“平均法”,即将这k个样本的实值输出标记的平均值作为预测结果;还可以基于距离远近进行加权平均或加权投票,距离越近的样本权重越大。[1]      kNN的伪代码如下:[2]          对未知类别属性的数据集中的每个点依次执行以下操作:          (1)计算已知类别数据集中的点与当前点之间的距离;          (2)按照距离递增次序排序;          (3)选取与当前点距离最小的k个点;          (4)确定前k个点所在类别的出现频率;           (5)返回前k个点出现频率最高的类别作为当前点的预测分类。      以下通过图来进一步解释:   假定要对紫色的点进行分类,现有红绿蓝三个类别。此处以k为7举例,即找出到紫色距离最近的7个点。 分别找出到紫色距离最近的7个点后,我们将这七个点分别称为1、2、3、4、5、6、7号小球。其中红色的有1、3两个小球,绿色有2、4、5、6四个小球,蓝色有7这一个小球。 显然,绿色小球的个数最多,则紫色小球应当归为绿色小球一类。