cf

Word Embedding 稳定性研究

回眸只為那壹抹淺笑 提交于 2020-10-28 17:30:23
https://zhuanlan.zhihu.com/p/113339927 我们在production的系统里面会遇到一个问题,模型如何处理新进来的数据。重新训练的话下游的prediction可能会非常不一样,但是我们不知道到底怎么不一样。之前在MLSys 2020 看到了这个关于稳定心的文章,所以跟大家分享一下。这个paper尝试总结retraining对embedding的影响到底有多大,原文在这里 https://proceedings.mlsys.org/static/paper_files/mlsys/2020/104-Paper.pdf ​ proceedings.mlsys.org 既然我们要讨论稳定性,我们得先给一个稳定性的定义 这个定义的逻辑本身是根据下游的task来定义上游够不够稳定,如果完全稳定的话下游的模型就不用retrain了。这里文章讲用zero one可能是因为讨论的是NLP的问题,假设是ctr的话这种zero one loss就不合理。 对于word embedding的算法,文中用了三种 Matrix Completion GloVE word2vec quantization用的是uniform quantization,原文在这里 https://arxiv.org/pdf/1909.01264.pdf ​ arxiv.org

JAVA WEB项目大文件上传下载源代码

天大地大妈咪最大 提交于 2020-04-10 13:40:08
1、介绍enctype enctype 属性规定发送到服务器之前应该如何对表单数据进行编码。 enctype作用是告知服务器请求正文的MIME类型(请求消息头content-type的作用一样) 1、1 enctype的取值有三种 值 描述 application/x-www-form-urlencoded 在发送前编码所有字符(默认) multipart/form-data 不对字符编码。每一个表单项分割为一个部件 text/plain 空格转换为 “+” 加号,但不对特殊字符编码。 1. 当enctype=’application/x-www-form-urlencoded’ 2.当enctype=’multipart/form-data’ 通过观察发现这个的请求体就发生了变化。这种请求体被称之为多部件请求体。 什么是多部件请求体:就是把每一个表单项分割为一个部件。 以请求头的content-type的boundary后面的一串随机字符串作为分割标识 普通表单项: //name的意思是文本框里面name的属性值,而admin是我们输入的文本值 Content-Disposition: form-data; name="username" admin 文件表单项 //filename的意思是:我们上传的文件名称,content-Type的意思是:MIME类型

wifi信道

冷暖自知 提交于 2020-04-10 11:37:31
无线WiFi信道重叠会互相干扰。建议选择1,6,11这三个互不干扰的信道。当然,周围WiFi设备较少的情况下可以选择自动模式。 1.无线WiFi2.4Ghz频段的WiFi总共有14个信道,如下图所示: 整个频段内只有3个互不干扰信道,分别是1,6,11。 802.11工作组划分了两个独立的频段,2.4 GHz和4.9/5.8 GHz。每个频段又划分为若干信道。在中国:2.412 ~ 2.472 GHz:13个信道,5.725 ~ 5.825 GHz:4个信道 2.信道重叠会影响WiFi网络稳定。 Wi-Fi的每个频道实际上占用了周边±2个信道,所以除了1、6和11号别的都会冲突。而两个路由器,当信道编号一样时,它们会相互协作工作的时间片,用时段来区分不同的路由器信号。而两个路由器的信道编号不同,那么这种协作关系也就无法建立了。这两种干扰,第一种叫“协作信道干扰(Co-Channel)”,第二种叫“重叠信道干扰(Overlapping)”,第二种干扰才是真的干扰。 3.设置合适的WiFi信道可以防止互相干扰现象。 选择WiFi信道时 636f70797a686964616f31333365653138应选择互不干扰信道(1,6,9),否则损人而不利己。同时也应选择占用较少的信道。 延伸: 1.WiFi信道检测软件,如inSSIDer

RxJava2+Retrofit2+RxLifecycle3+OkHttp3网络请求封装(动态演示)

感情迁移 提交于 2020-04-10 11:21:11
入职公司后,公司要求组件化开发,经过讨论后我将网络请求框架单独进行了封装,不过当时框架里将常用的 util 和 ui 均放入到了共同的 Common 包下,导致里面部分代码耦合,后来为了降低耦合性又将 Common 拆分为了lib_common和lib_ui,但是 lib_ui 依赖了 lib_common,还是导致部分代码耦合,最新一期为了降低组件之间的耦合性,所以单独将 lib_common 中的网络请求单独拆分,并且我又做了新的封装和完善,总之网络框架经过3次大的改造后,使用已经非常稳定了。 使用步骤 1.在Application类中进行初始化操作 ApiConfig build = new ApiConfig.Builder() .setBaseUrl(baseUrl)//BaseUrl,这个地方加入后项目中默认使用该url .setInvalidateToken(0)//Token失效码 .setSucceedCode(200)//成功返回码 .setFilter("com.mp5a5.quit.broadcastFilter")//失效广播Filter设置 //.setDefaultTimeout(2000)//响应时间,可以不设置,默认为2000毫秒 //.setHeads(headMap)//动态添加的header,也可以在其他地方通过ApiConfig

能听会说、还支持手写,讯飞这款智能笔记本也许能让你爱上学习

你离开我真会死。 提交于 2020-04-10 09:09:50
摘要 一个集阅读、写作、办公为一体的「效率神器」。 你所期待的笔记本是什么样子?有人重视书写手感,只要有一支笔、一个本子就够了;有人觉得长久保存更重要,所以会选择一些笔记应用;想要两者兼备的话,现在市面上的电纸书是个不错的选择。在这个领域讯飞是个很独特的存在,去年我们就介绍过 讯飞智能办公本 ,它除了阅读和手写之外,还加入了讯飞擅长的语音功能,把电纸书设备的效率提升了一大截。 最近,极客之选(微信:GeekChoice)收到了这个系列的新产品「咪咕讯飞智能笔记本」,它的定位更偏年轻,主打青年商务人士和学生群体,设计风格上更青春。我们使用一段时间后发现,也许它能让更多人爱上手写笔记。 定位更年轻,「商务气息」没那么浓了 一个电纸书、一根手写笔,它既是电子书阅读器,又是一个电子笔记本,还能当录音笔来使用。把这些功能结合在一起,就成了一个集阅读、写作、办公为一体的「效率神器」。 这款讯飞智能笔记本整体为白色外观,9.7 英寸屏幕,重量为 430 克。相比之前的讯飞智能办公本,它在屏幕右侧增加了两个物理翻页键,正面看上去更有设计感。 背面也使用了特殊的布艺材质,摸起来手感很舒适,并且防滑,看上去也很有特色。 手写笔在不用时可以放在右侧的插槽中,不易丢失。它的正面上方和机身底部分别有麦克风和扬声器,这都是在为讯飞的语音功能做支持,我们下面会详细讲。 续航方面,它的电池容量为 4100mAh

小狗 T12 智能无线吸尘器体验:让打扫这件事简单点

為{幸葍}努か 提交于 2020-04-10 09:09:21
摘要 或许你缺这么一件趁手的无线吸尘器。 比起收拾自己的热情,年轻人收拾房间的动力可能几乎为零,心血来潮的大扫除也并不能维持太久。 除了平时工作太忙以外,没有一件趁手的清扫「兵器」大概就是主要原因。扫把簸箕太难用,市面上的吸尘器快挑花了眼。就在前不久,专业吸尘器品牌小狗吸尘器于 4 月 2 日发布了一款名为小狗 T12 智能无线吸尘器的全新产品。或许它的出现,能帮你让打扫这件事「简单点」。 小狗 T12 智能无线吸尘器包装内包含了主机、金属延长管、双滚电动地刷、电动除螨刷、二合一宽嘴刷、扁吸嘴以及收纳充电座和挂墙充电架。这四款吸头可以应对绝大部分的居家清洁场景,其中双滚电动地刷可以在任何地面环境上使用,不需要根据场景更换刷头。 金属延长管为氧化处理的铝合金材质,连接主机之后的枪式造型结构十分简洁。主机还配备了 OLED 智能显示屏、透明 PC 材质的磁吸式尘杯,机身整体色调保持一致。 吸尘器最重要的当然就是吸力,小狗官方称 T12 智能无线吸尘器的吸入功率高达 170AW,比上代旗舰产品 T10 Plus 同比提升 41.6%,整机过滤系统也能拦截 99.996% 的微尘。值得一提的是,小狗首次将智能理念注入了无线手持吸尘器当中,同时也是小狗 T12 这款新品的主打卖点。从主机顶部 OLED 显示屏后方我们能看到霍尔开关,它有三种模式可供选择,强劲、自动、节能。需要注意的是,小狗

内附PPT下载 | 性能为MySQL10倍!阿里云重磅推出云原生数据仓库AnalyticDB基础版

◇◆丶佛笑我妖孽 提交于 2020-04-10 07:53:00
发布会PPT资料放送 ADB基础版:云原生MySQL敏捷数仓 ADB for MySQL 基础版技术解密 基于ADB for MySQL基础版构建实时数据仓库实践 日前,阿里云正式发布云原生数据仓库AnalyticDB基础版,极大降低了用户构建数据仓库的门槛,每月可低至860元。高度兼容MySQL,极低的使用成本和极高的性能,使中小企业也可以轻松的搭建一套实时数据仓库,实现企业数据价值在线化。 据介绍,云原生数据仓库AnalyticDB基础版采用存储计算分离架构,行列混存技术、轻量的索引构建方式和分布式混合计算引擎,确保任意极度复杂的SQL都有较好的性能。 我们将基础版T8规格(8Core 64GB)和MySQL(52Core 384GB)进行TPC-H 100GB测试,结果显示:基础版Total时间为1898.46秒,MySQL Total时间为18188.12秒,基础版T8规格比较MySQL有10倍性能提升。另外,基础版有丰富的规格,可进一步满足客户不同性能要求,而且各种规格之间可以在线升降配,秒级切完全不影响业务。 云原生数据仓库AnalyticDB for MySQL产品系列以及使用场景如下介绍,相比较MySQL,基础版复杂分析性能优势较明显,可以完美解决MySQL客户复杂分析查询卡顿问题。相比较集群版,基础版主打成本和易用性,其性能为单节点集群版平均1/5

周六直播报名丨文因互联CEO鲍捷:RPA如何从1.0走到4.0时代?

血红的双手。 提交于 2020-04-09 20:11:08
​当提起RPA,你会想起按键精灵,想起自动搬运和分析数据的程序。 在文因互联CEO鲍捷看来,这是RPA的1.0和2.0时代,即是对手和对脑的自动化,由自动化体力劳动向自动化脑力劳动转变。 但RPA显然不会停留在这样的初级形态,它的升级版本会是怎样的?对企业自身和RPA行业而言又意味着什么? 鲍捷曾在采访中表示,“流程自动化不光只是某个特定业务环节的优化,还有各种传统企业流程之间的打通——只要是有传统企业流程,有IT系统的地方,都会自动化的。” “(机器做流程性工作)这个趋势,我相信,每个赛道都会发生这样的变化,十年之内不会停下来。” 在这样的趋势下,我们更需要一把精确锋利的手术刀,深度剖析RPA。 4月11日,文因互联CEO、联合创始人鲍捷将带来更全面专业的解读,细述RPA从 1.0 到 4.0 的关键升级路径。 如何收听? 关注公众号「 AI金融评论 」,在公众号对话框回复关键词“ 听课 ”,即可进群观看直播。 若无法进群,请添加微信: LorraineSummer 申请进群。 直播信息 时间:4月11日(周六)20:00-21:00 主讲人:文因互联CEO、联合创始人 鲍捷 主题:从 RPA 1.0 到 RPA 4.0,知识产业流程自动化的关键路径 分享提纲 RPA1.0:自动化手,结构化数据数据应用间自由迁移 RPA2.0:自动化手,数据类型全覆盖后的智能建模分析 RPA3

性能优化之连接运算

Deadly 提交于 2020-04-09 18:50:38
【摘要】 JOIN 是 SQL 中用于多表关联的运算,无论从程序员编写还是数据库实现角度来看,JOIN 都是 SQL 中最难的运算。SQL 对 JOIN 的定义确实非常简单,就是对两个集合 (表) 做笛卡尔积后再按某种条件过滤,而且简单的内涵将得到更大的外延,可以把多对多等值 JOIN 甚至非等值 JOIN 等都包括进来。但是,过于简单的内涵无法充分体现出最常见等值 JOIN 的运算特征。这会导致编写代码和实现运算时就不能利用这些特征,在运算较为复杂时(涉及关联表较多以及有嵌套的情况),无论是书写还是优化都非常困难。而充分利用这些特征后,我们就能创造更简单的书写形式并获得更高效率的运算性能。 来源: oschina 链接: https://my.oschina.net/u/4265788/blog/3226263

直播丨微软超级麻将AI Suphx 如何荣升十段?研发团队深度揭秘技术细节

萝らか妹 提交于 2020-04-09 18:43:35
作为在中国乃至整个亚洲地区都家喻户晓的大众娱乐项目,麻将仅在亚洲地区就拥有上亿玩家。极高的普及度使得很多人都认为麻将是一项十分容易的棋牌类游戏。然而,虽然麻将入门容易,但要真正打好麻将、精通麻将却十分困难。以国际知名专业麻将平台天凤(http://tenhou.net)为例,平台上超过35万的活跃玩家中,只有不到1%的玩家达到了专业7段及以上的高手水平。 2019年8月,由微软亚洲研究院研发的麻将AI系统Suphx成为首个在国际知名专业麻将平台“天凤”上荣升十段的 AI 系统,其实力超越该平台公开房间顶级人类选手的平均水平 。麻将AI 到底有哪些难点?Suphx这一在游戏AI领域具有跨越性的突破具体是如何实现的? 本次直播Suphx研究团队的研究员将为大家深度解读最新发布的相关论文的核心内容和技术细节。 一、直播介绍 分享主题:微软超级麻将AI Suphx 如何荣升十段?研发团队深度揭秘技术细节 直播时间:2002年4月9日下午15:30-16:15 直播链接:http://www.mooc.ai/open/course/792 (回放地址相同) 二、分享嘉宾 秦涛,微软亚洲研究院首席研究员 李俊杰,微软亚洲研究院高级研究工程师 三、更多论文信息 对 Suphx 技术感兴趣的同学可以在这里阅读论文,了解更多细节: https://arxiv.org/abs/2003