chi

OSChina 周日乱弹 —— 我的美丽星期天还剩下3个小时了

和自甴很熟 提交于 2020-10-18 02:49:39
Osc乱弹歌单(2020)请戳( 这里 ) 【今日歌曲】 小小编辑推荐, 《当你老了 (Live)》- 莫文蔚 手机党少年们想听歌,请使劲儿戳( 这里 ) @ 天小落落 :996的日子真难受,听说996做完项目后还要裁员! 那还愣着干嘛, 赶紧跑啊, 难道等着过劳死啊? 企业家们不在乎这些, @ jackydosuo :把加班说成福报的伪企业家,毫无廉耻。 “不如去培训一下保洁阿姨,然后工资和她三七分。” 现在最高兴的事情就是下班了, @ Xiaoshiyue :哈哈哈哈哈下班! 但是下班后的时间过得太快了! 一眨眼! 就这么点时间, 别人还惦记着呢, @ 野渡无人舟自横 :村里发通知让23岁以上未婚青年报名参加zf组织的七夕相亲交友活动,看来这几年生育率太低了 可是现在不想相亲呀, 我未来再去相亲, “富婆相亲记。” 老了就不会因为对A被嫌弃了啊? @ RYAN_____ :妹子胸口很白,锁骨很漂亮,让人忍不住多看几眼,就是对A,要不起啊 #地铁见闻# 那你地铁遇到了她, 要不要去认识一下? @ Daniel-01 :不行,一楼那妹子刚才又上来了,实在太对我眼了,我不跟她转弯抹角了,直接在钉钉要她微信,肯就肯,不肯就算了。我摊牌了,俺想认识你 “你是对的,去了也是自取其辱 。” 其实你们是一类人的话, 自然就会互相吸引。 @ sund4y :女朋友是我们公司的测试人员

持续更新 EMNLP2020 Summarization

99封情书 提交于 2020-10-10 12:53:15
Long Multi-Fact Correction in Abstractive Text Summarization . Yue Dong, Shuohang Wang, Zhe Gan, Yu Cheng, Jackie Chi Kit Cheung and Jingjing Liu. Unsupervised Reference-Free Summary Quality Evaluation via Contrastive Learning. Hanlu Wu, Tengfei Ma, Lingfei Wu, Tariro Manyumwa and Shouling Ji. Multi-document Summarization with Maximal Marginal Relevance-guided Reinforcement Learning. Yuning Mao, Yanru Qu, Yiqing Xie, Xiang Ren and Jiawei Han. MLSUM: The Multilingual Summarization Corpus. Thomas Scialom, Paul-Alexis Dray, Sylvain Lamprier, Benjamin Piwowarski and Jacopo Staiano. Stepwise

t分布, 卡方x分布,F分布

南笙酒味 提交于 2020-08-20 00:57:47
T分布:温良宽厚 本文由“医学统计分析精粹”小编“Hiu”原创完成,文章采用知识共享Attribution-NonCommercial-NoDerivatives 4.0国际许可协议(http://creativecommons.org/licenses/by-nc-nd/4.0/)进行许可,转载署名需附带本号二维码,不可用于商业用途,不允许任何修改,任何谬误建议,请直接反馈给原作者,谢谢合作! 命名与源起 “t”,是伟大的Fisher为之取的名字。Fisher最早将这一分布命名为“Student's distribution”,并以“t”为之标记。 Student,则是William Sealy Gosset(戈塞特)的笔名。他当年在爱尔兰都柏林的一家酒厂工作,设计了一种后来被称为t检验的方法来评价酒的质量。因为行业机密,酒厂不允许他的工作内容外泄,所以当他后来将其发表到至今仍十分著名的一本杂志《Biometrika》时,就署了student的笔名。所以现在很多人知道student,知道t,却不知道Gosset。(相对而言,我们常说的正态分布,在国外更多的被称为高斯分布……高斯~泉下有知的话,说不定会打出V字手势~欧耶!) 看懂概率密度图 这一点对于初学者尤为重要,相信还是有不少人对正态分布或者t分布的曲线没有确切的理解。 首先,我们看一下频率分布直方图,histogram:

希腊字母读法及含义

六月ゝ 毕业季﹏ 提交于 2020-08-17 03:02:12
文章转载,参考 https://blog.csdn.net/chehec2010/article/details/90204622 序号 大写 小写 英语音标注音 英文 汉语名称 常用指代意义 1 Α α /'ælfə/ alpha 阿尔法 角度、系数、角加速度、第一个、电离度、转化率 2 Β β /'bi:tə/ 或 /'beɪtə/ beta 贝塔 磁通系数、角度、系数 3 Γ γ /'gæmə/ gamma 伽玛 电导系数、角度、比热容比 4 Δ δ /'deltə/ delta 得尔塔 变化量、焓变、熵变、屈光度、一元二次方程中的判别式、化学位移 5 Ε ε /'epsɪlɒn/ epsilon 艾普西隆 对数之基数、介电常数、电容率 6 Ζ ζ /'zi:tə/ zeta 泽塔 系数、方位角、阻抗、相对黏度 7 Η η /'i:tə/ eta 伊塔 迟滞系数、机械效率 8 Θ θ /'θi:tə/ theta 西塔 温度、角度 9 Ι ι /aɪ'əʊtə/ iota 约(yāo)塔 微小、一点 10 Κ κ /'kæpə/ kappa 卡帕 介质常数、绝热指数 11 ∧ λ /'læmdə/ lambda 拉姆达 波长、体积、导热系数 普朗克常数 12 Μ μ /mju:/ mu 谬 磁导率、微、动摩擦系(因)数、流体动力黏度、货币单位,莫比乌斯函数 13 Ν ν

t分布, 卡方x分布,F分布

耗尽温柔 提交于 2020-08-14 23:00:47
T分布:温良宽厚 本文由“医学统计分析精粹”小编“Hiu”原创完成,文章采用知识共享Attribution-NonCommercial-NoDerivatives 4.0国际许可协议(http://creativecommons.org/licenses/by-nc-nd/4.0/)进行许可,转载署名需附带本号二维码,不可用于商业用途,不允许任何修改,任何谬误建议,请直接反馈给原作者,谢谢合作! 命名与源起 “t”,是伟大的Fisher为之取的名字。Fisher最早将这一分布命名为“Student's distribution”,并以“t”为之标记。 Student,则是William Sealy Gosset(戈塞特)的笔名。他当年在爱尔兰都柏林的一家酒厂工作,设计了一种后来被称为t检验的方法来评价酒的质量。因为行业机密,酒厂不允许他的工作内容外泄,所以当他后来将其发表到至今仍十分著名的一本杂志《Biometrika》时,就署了student的笔名。所以现在很多人知道student,知道t,却不知道Gosset。(相对而言,我们常说的正态分布,在国外更多的被称为高斯分布……高斯~泉下有知的话,说不定会打出V字手势~欧耶!) 看懂概率密度图 这一点对于初学者尤为重要,相信还是有不少人对正态分布或者t分布的曲线没有确切的理解。 首先,我们看一下频率分布直方图,histogram:

特征选择

和自甴很熟 提交于 2020-08-13 09:58:10
过滤法 单变量特征选择通过单变量统计检验选择特征 SelectKBest只保留K个最高分的特征 SelectPercentile只保留用户指定的百分比的最高得分的特征 使用常见的单变量统计检验 分类: 使用chi2卡方 f_classif方差分析 mutual_info_classif互信息 回归: 使用f_regression相关系数 mutual_info_regression互信息 # 方差过滤 from sklearn . feature_selection import VarianceThreshold from sklearn . datasets import load_digits digits = load_digits ( ) X = digits . data y = digits . target print ( X . shape ) X_var = VarianceThreshold ( threshold = 0.1 ) . fit_transform ( X ) print ( X_var . shape ) # 卡方过滤 from sklearn . feature_selection import SelectKBest , chi2 from sklearn . datasets import load_digits digits =

docker中基于centos7.3搭建tesseract5环境以及制作镜像

北战南征 提交于 2020-08-12 04:51:05
  由于需要离线安装tesseract,于是想到用docker镜像的方式部署tesseract。采用 docker commit 基于容器构建镜像。   总体思路是先拉一个基础的centos镜像,然后启动之后进入容器安装好tesseract之后commit为镜像。然后镜像save为tar包。这样就可以实现离线安装。(这也可以作为常见的一种制作自己的镜像的思路)   其实linux环境安装tesseract也是下面步骤,只是不用下载一个基础的centos镜像以及最后将容器制作为镜像。 0.准备文件 (1)tesseract源码文件: git下载地址: https://github.com/tesseract-ocr/tesseract (2)leptonica-1.79.0.tar.gz。 tesseract依赖该项目 (3)语言包 其实只需要 chi_sim.traineddata 和 eng.traineddata 可以从git下载。git有两个版本,一个fast版本、一个best版本。 fast: https://github.com/tesseract-ocr/tessdata_fast best: https://github.com/tesseract-ocr/tessdata_best   这两个的区别是fast版本语言库文件比较小,识别速度比较快

Efficient Sparse Pose Adjustment(SPA) for 2D Mapping 论文总结

霸气de小男生 提交于 2020-08-12 03:06:55
Konolige K , Grisetti G , Rainer Kümmerle, et al. Efficient sparse pose adjustment for 2D mapping[C]// 2010 IEEE/RSJ International Conference on Intelligent Robots and Systems. IEEE, 2010. 这是一篇讲解2D建图中的高效稀疏矩阵图优化的文章,谷歌的cartographer激光slam中位姿图优化主要便是基于思想来实现的。文章主要贡献是在 L M LM L M 优化过程中使用乔里斯基分解(Cholesky decomposition)实现稀疏 H H H 矩阵下的状态增量 Δ \Delta Δ x高效快速求解。 1. 摘要 图优化已经成为一种解决slam问题的主流方法。位姿图是由一系列非线性约束连接机器人位姿点构成,这些约束来自于位姿点周围共同的特征观测。由于直接非线性优化的计算时间与图的大小的3次方成比例增长, 优化大型位姿图 成为移动机器人一个比较大的瓶颈问题。文章为了解决这个问题, 提出一种有效的方法去构建和解决其中的线性化子问题 ,这是常规直接非线性优化方法中的性能瓶颈所在。作者将文中所提方法命名为 SPA(Sparse Pose Adjustment )

如何用搜狗拼音输入法输入希腊字母及各种上下标

非 Y 不嫁゛ 提交于 2020-08-11 18:14:42
本篇介绍使用搜狗拼音输入法输入希腊字母 工具/原料 搜狗拼音输入法 方法一:软键盘 右击输入法悬浮窗打开菜单-选择软键盘 这里有很多软键盘,其中第二个就是希腊字母软键盘,点击打开 第二次使用可以点击输入法悬浮窗上的软键盘快捷键来快速打开 缺点:使用这个方法要在20多个希腊字母里面寻找,比较考验眼力;输入时必须打开软键盘,输入完再关闭软键盘才能输入其他字符。 END 方法二:自定义短语 右键-设置属性 高级-自定义短语设置 直接编辑配置文件 将以下内容复制粘贴到配置文件最后 ; 希腊字母 alpha,4=α alpha,5=Α beta,4=β beta,5=Β gamma,4=γ gamma,5=Γ delta,4=δ delta,5=Δ epsilon,4=ε epsilon,5=Ε zeta,4=ζ zeta,5=Ζ eta,4=η eta,5=Η theta,4=θ theta,5=Θ iota,4=ι iota,5=Ι kappa,4=κ kappa,5=Κ lambda,4=λ lambda,5=Λ mu,4=μ mu,5=Μ nu,4=ν nu,5=Ν xi,4=ξ xi,5=Ξ omicron,4=ο omicron,5=Ο pi,4=π pi,5=Π rho,4=ρ rho,5=Ρ sigma,4=σ sigma,5=Σ tau,4=τ tau,5=Τ

日语入门五十音这些坑,初学日语的伙伴细读

荒凉一梦 提交于 2020-08-11 05:04:05
日语初学者刚开始学习五十音图的过程中,会犯很多的错误。现在就列举一下日语入门的学习者在接触五十音图及其日语基本发音时常容易出现的问题,并一一解答,帮读者扫清日语入门的第一道门槛。下面的日语学习资讯包括五十音图的发音、长音和促音、浊音、元音无声化等内容。 (1)五十音的发音 习惯汉语发音的人,很容易把五十音图中的很多假名读音读错。比如: 那么先来测一测你的五十音小天赋https://sourl.cn/Pzx2Sb(复制打开) 「し」:罗马音是“si”就直接读成“思” 「ふ」:读成“夫” 「す」:读成“思” 「つ」:读“吃”“资” 这些发音都是不正确的,为什么会出现这样的问题了,主要是很多同学在发音的时候,往往会按照汉语的方式来发日语的音,这种发音方法显然是不正确的,日语和汉语是两种不同的语言,因此对表音的字母(日语叫罗马字或罗马音;中文叫拼音)的发音是不一样,它们都有各自的发音特点,所以,初学者切记不要直接用中文的方式直接去拼读日文的假名,这些都是不正确的,一定要掌握每个假名的发音特点,按照录音来模仿练习。 (2)长音发音太短或促音不见 因为在中文中没有延长发音的习惯,所以很多日语入门者在遇到日语长音时,会不自觉的缩短发音或干脆就直接跳过,这些都是不对的,例如: 将「おばあさん」发成「おばさん」;「空気(くうき)」发成「くき」, 这些不对的发音习惯会直接影响单词的意思,比如第一组单词