evolution

机器学习笔记-遗传算法

随声附和 提交于 2020-08-17 04:00:51
进化算法之遗传算法 进化算法Evoluation Algorithms(EAs)有以下三个特征: Population-Based:进化算法的优化过程可以描述为:从当前一些比较差的解集当中生成相对比较好的一点的解集。而当前的解集叫做Population。 Fitness-Oriented: 如果现在已经有了许多解,那该怎么比较两个解的好坏呢?因此就需要一个衡量一个解好坏的标准:适应性函数。适应性函数能对每一个解赋予它们一个对应的适应度。 Variation-Driven:如果在当前的pululation中没有合适的解或者不是最优解,我们就希望做点什么从而得到最优解。因此,这是,每一个解都要经过一些变化,去产生新的解。 下面介绍一个具体的算法:遗传算法 Genetic Algorithm(GA) 遗传算法(Genetic Algorithm, GA) 遗传算法是基于随机的经典进化算法。这里随机的意思是,为了使用遗传算法找到一个解,我们将把一些随机变换应用到当前的解里,从而产生变化,生成新的解。注意:遗传算法(EA)也会被叫做简单遗传算法(Simple Genetic Algorithm,SGA),原因就是它相比于其他遗传算法来说是最简单的。 遗传算法启发与达尔文的进化论。这是一个缓慢渐进的过程,通过做出微小又缓慢的改变发挥作用。因此,遗传算法也是通过对现有解做微小又缓慢的改变

阿里定向广告新一代主模型:基于搜索的超长用户行为建模范式

最后都变了- 提交于 2020-08-15 23:14:16
  机器之心发布    机器之心编辑部    阿里提出并实现了一套基于搜索范式的超长用户行为建模新方法Search-based user Interest Model(SIM),用于解决工业级应用大规模的用户行为建模的挑战。      对用户沉淀的海量历史行为数据进行充分的理解和学习, 是电商、信息流、短视频推荐这类强用户行为反馈驱动的应用中,近几年技术研发的关键方向,尤其是 CTR 模型这个领域,更是关键的胜负手。   以淘宝为例,大量的用户在网站上沉淀了长达数年甚至十几年的历史行为数据:平均每个用户每年产生的点击量超过了 10000,更不用提其中高频用户的活跃行为了。然而,如何建模这种超长行为序列的数据,学术界和工业界都还在早期阶段摸索。传统的如 LSTM、Transformer 等序列建模的技术,普遍适用于序列数据长度在 100 以内的情况,当序列长度提高一个数量级达到 1000 以上时,都会存在困难;此外,即使离线模型能够处理,如何将模型部署到实际生产系统,在时延和吞吐上都达到工业级标准,更是极具挑战的难题。   18 年我们团队研发上线、19 年在 KDD 上披露的 MIMN[1],是业界首个处理超长行为序列的工业级解决方案,其提出了一套能够对长达 1000 长度的行为序列数据进行训练和在线 serving 的整体解决方案。然而,MIMN 算法基于的是 memory

Hacker News 简讯 2020-07-27

大憨熊 提交于 2020-08-14 22:39:29
最后更新时间: 2020-07-27 23:01 How popular media portrays the employability of older software developers - (arxiv.org) 大众媒体如何描述老软件开发人员的就业能力 得分:150 | 评论:129 The Rise of Synthetic Audio Deepfakes - (nisos.com) 合成音频假货的兴起 得分:33 | 评论:4 Show HN: UnnaturalScrollWheels – Better scroll wheel settings for macOS - (github.com) Show HN:UnnaturalScrollWheels–macOS的滚轮设置更好 得分:21 | 评论:0 How to pay your rent with your open source project - (plausible.io) 如何使用开源项目支付租金 得分:197 | 评论:93 What the heroin industry can teach us about solar power - (bbc.com) 海洛因工业能教我们什么太阳能 得分:67 | 评论:37 ACCC alleges Google misled consumers

模型加速 | 华为提出高效的模型加速框架(附源码)

ε祈祈猫儿з 提交于 2020-08-13 04:59:06
计算机视觉研究院专栏 作者:Edison_G 1.摘要 模型效率在计算机视觉领域中越来越重要。作者目前神经网络结构搜索的网络性能已经超越了人工设计的网络,搜索方法大致可以分为强化学习、进化算法以及梯度三种,有研究表明进化算法能比强化学习搜索到更好的模型,但其搜索耗时较多,主要在于对个体的训练验证环节费事。可以借鉴ENSA的权重共享策略进行验证加速,但如果直接应用于进化算法,超网会受到较差的搜索结构的影响,因此需要修改目前神经网络搜索算法中用到的进化算法。为了最大化上一次进化过程学习到的知识的价值,论文提出了连续进化结构搜索方法(continuous evolution architecture search, CARS)首先初始化一个有大量cells和blocks的超网(supernet),超网通过几个基准操作(交叉、变异等)产生进化算法中的个体(子网),使用Non-dominated 排序策略来选取几个不同大小和准确率的优秀模型,然后训练子网并更新子网对应的超网中的cells,在下一轮的进化过程会继续基于更新后的超网以及non-dominated排序的解集进行。另外,论文提出一个保护机制来避免小模型陷阱问题。 2.背景 卷积神经网络在识别、检测和分割等大量计算机视觉任务中取得了很大的进展。Over-parameterized的深层神经网络可以产生令人印象深刻的性能

Polar码快速入门

老子叫甜甜 提交于 2020-08-12 07:44:43
Polar码快速入门 本科生在学习极化码时,并不是件简单的事情。网上极化码的资料很少,而且基本上都是较难的论文。这篇文章是用来帮你快速入门极化码。 Poalr码背景 2015 年,国际电信联盟无线通信部(International Telecommunication Union-Radio Communications Sector,ITU-R)明确了未来 5G三大典型应用场景,分别为: 增强型移动宽带(enhanced mobile broadband, eMBB )场景。要求支持更高的传输速率(峰值速率:上行链路达到 10 Gbit/s,下行链路达到 20 Gbit/s)、更高的频谱效率(峰值频谱效率:上行链路达到12 bit/(s·Hz),下行链路达到 30 bit/(s·Hz))等。 大规模机器类通信(massive machine type communication, mMTC )。要求支持更大连接数密度( \(1×10^6\) 个连接 \(/km^2\) )、更低能耗(终端电池使用寿命达到 15 年); 场景和超高可靠性低时延通信(ultra-reliable and low latency communication, uRLLC )场景。要求支持更低的时延(上下行链路时延 0.5 ms,即端到端时延低于 1 ms)、更高的可靠度(达到 99.9999%,即 1

4G网络免费开通高清语音VoLTE

和自甴很熟 提交于 2020-08-12 04:24:20
一、什么是高清语音VoLTE 高清语音VoLTE即VoiceoverLTE,VoLTE(Voice over Long-Term Evolution)长期演进语音承载,它是一种IP数据传输技术,无需2G/3G网络,全部业务承载于4G网络上,可实现数据与语音业务在同一网络下的统一。简单来说,4G网络VoLTE高清语音可以实现边上网边打电话的功能,因为4G网络VoLTE下不仅仅提供高速率的数据业务,同时还提供高质量的音视频通话。 二、如何开通4G网络VoLTE 工欲善其事,必先利其器。小伙伴们可以免费开通使用VoLTE高清语音通话啦!VolTE功能打电话不仅声音清晰,而且可以边打电话边上网。并且可以让手机短信通过4G网络传输,防范无线监听窃取短信。 4G网络VoLTE如何开通呢? 第一步:打电话给客服要求开通VoLTE这个功能; 第二步:在手机设置里开启VoLTE高清语音通话; 第三步:完成以后手机屏幕顶上会显示HD的图标,High Definition 高清晰度已打开。 来源: oschina 链接: https://my.oschina.net/u/4365856/blog/4478278

阿里定向广告新一代主模型:基于搜索的超长用户行为建模范式

孤者浪人 提交于 2020-08-12 03:45:06
阿里提出并实现了一套基于搜索范式的超长用户行为建模新方法Search-based user Interest Model(SIM),用于解决工业级应用大规模的用户行为建模的挑战。 对用户沉淀的海量历史行为数据进行充分的理解和学习, 是电商、信息流、短视频推荐这类强用户行为反馈驱动的应用中,近几年技术研发的关键方向,尤其是 CTR 模型这个领域,更是关键的胜负手。 以淘宝为例,大量的用户在网站上沉淀了长达数年甚至十几年的历史行为数据:平均每个用户每年产生的点击量超过了 10000,更不用提其中高频用户的活跃行为了。然而,如何建模这种超长行为序列的数据,学术界和工业界都还在早期阶段摸索。传统的如 LSTM、Transformer 等序列建模的技术,普遍适用于序列数据长度在 100 以内的情况,当序列长度提高一个数量级达到 1000 以上时,都会存在困难;此外,即使离线模型能够处理,如何将模型部署到实际生产系统,在时延和吞吐上都达到工业级标准,更是极具挑战的难题。 18 年我们团队研发上线、19 年在 KDD 上披露的 MIMN[1],是业界首个处理超长行为序列的工业级解决方案,其提出了一套能够对长达 1000 长度的行为序列数据进行训练和在线 serving 的整体解决方案。然而,MIMN 算法基于的是 memory network,在处理更大规模的序列数据时,容易被数据的噪声干扰

Ubuntu MATE 20.04 LTS:士别三日,当刮目相待 | Linux 中国

北慕城南 提交于 2020-08-11 10:57:17
Ubuntu MATE 20.04 LTS 无疑是最流行的 Ubuntu 官方特色版本之一。 来源: https:// linux.cn/article-12341- 1.html 作者:Ankush Das 译者:郑 (本文字数:3080,阅读时长大约:4 分钟) Ubuntu MATE 20.04 LTS 无疑是最流行的 Ubuntu 官方特色版本 之一。 不仅仅是我,这份 Ubuntu 20.04 调查报告 也持同样观点。不过不管流行与否,它都是一个令人印象深刻的 Linux 发行版,尤其是用在较旧的硬件上时。事实上,它也是可用的 最轻量的 Linux 发行版 之一。 所以,我想在一个虚拟机中尝试一下,为你提供一个概览,这样你可以了解其中有何值得期盼的变化,以及是否值得尝试。 在 Ubuntu MATE 20.04 LTS 中有什么新功能? 知乎视频 ​ www.zhihu.com Ubuntu MATE 20.04 LTS 的主要亮点应该是增加了 MATE Desktop 1.24。 你可以期待 MATE Desktop 1.24 中的所有新特色都被打包到 Ubuntu MATE 20.04 中。除此之外,还有很多重要的变化、改进和增补。 这是 Ubuntu MATE 20.04 中变化的概述: 新增 MATE Desktop 1.24 大量视觉改进 数十处错误修复 基于

TD-LTE原理及其关键技术介绍

二次信任 提交于 2020-08-10 20:58:31
1. 用户感知网络指标 1.1 速率 C:信道容量 B:带宽 :信噪比 C是数据速率的极限值,单位bit/s;B为信道带宽,单位Hz;S是信号功率(瓦),N是噪声功率(瓦)。 当讨论信噪比时,常以分贝(dB)为单位。公式如下:SNR(信噪比,单位为dB)=10 lg(S/N)。 1.2 时延 网站/应用的所在机房的网络质量; 本地宽带的网络质量; 从本地访问至网站所经过的节点数量; 2. TD-LTE概述 (1)概述 LTE是long Term Evolution(长期演进)的缩写。 3GPP标准化组织最初制定LTE标准时,定位为3G技术的演进升级。后来,LTE技术的发展远远超出了预期,LTE的后续演进版本Release10/11(即LTE-A)被确定为4G标准。 LTE根据双工方式不同,分为LTE-TDD和LTE-FDD两种制式。 (2)TD-LTE核心技术: 扁平网络 干扰抑制技术ICIC 频分多址系统 MIMO技术 3. 频分多址技术OFDMA/SC-FDMA 下行OFDMA:用户在一定时间内独享一段干净的频段。 OFDM的英文全称是:Orthogonal Frequency Division Multiplexing LTE下行发射机采用以下哪种技术来实现OFDM:IFFT OFDM技术和传统的FDM技术相比较,可以提高频谱的利用率。 OFDM技术可以抵抗平坦性衰落

Eiffel: Evolutionary Flow Map for Influence Graph Visualization

眉间皱痕 提交于 2020-08-10 10:10:18
论文传送门 视频 作者 北京大学 Yucheng Huang Tong Yang 中国科学院软件研究所计算机科学实验室 Lei Shi Yue Su Deyun Wang 雅虎实验室 Yifan Hu 亚利桑那州立大学 Hanghang Tong 圣母大学 Chaoli Wang 清华大学美术学院 Shuo Liang 摘要 影响力演化图的可视化对于执行许多现实生活任务(例如引文分析和社会影响分析)很重要。主要挑战包括如何总结大规模、复杂和随时间变化的影响图,以及如何设计有效的视觉隐喻和动态表示方法来说明随时间推移的影响模式。在这项工作中,我们介绍了Eiffel,这是一个集成的可视化分析系统,该系统对节点,关系和时间纬度的影响力演化图进行了三次汇总。在数值实验中,就基于影响流的目标而言,Eiffel汇总结果优于传统聚类算法。此外,提出了一种流程图表示法,并适用于影响图摘要的情况,它支持两种演化可视化模式(即翻书和电影),以加快对影响图动力学的分析。我们进行了两个受控用户实验,以分别评估影响图摘要和可视化方面的技术。我们还在两种典型情况的影响力演化分析中展示了该系统,这两种情况是科学论文的引文影响和新兴在线事件的社会影响。评估结果证明了Eiffel在影响演化图的可视分析中的价值。 Introduction 影响力 Cyber-Influence (社交) Social