boxi

计算机本地文件消亡前史

不羁的心 提交于 2020-08-11 17:37:55
编者按:文件是数字世界的基石,是我们基本的工作单位。但是,随着互联网的云化、平台化、服务化,文件日益变得可有可无。这样一种改变究竟好不好呢?喜欢怀旧的Simon Pitt开始回顾各种文件的好处,哪怕这让他显得不合时宜。原文发表在medium上,标题是:Computer Files Are Going Extinct 我喜欢文件。我喜欢对文件重命名、移动、排序,改变它们在文件夹中的显示方式,去备份文件,将之上传到互联网,恢复它们,对其进行复制,甚至还可以对文件进行碎片整理。作为信息存储方式的一种隐喻,在我看来文件是很出色的。我喜欢把文件当作一个工作单位。如果我要写篇文章,文章会放在文件里面。如果我要生成图像,图像会保存进文件里面。 讴歌files.doc 文件是拟物化的。这是个很花哨的词,只是用来表示文件是反映现实物品的一个数字概念。比方说,Word文档就像一张纸,躺在你的办公桌上(desktop)。JPEG就像一幅画,等等。它们每个都有一个小图标,图标的样子看起来像它们所代表的现实物品。一堆纸,一个画框,一个马尼拉文件夹。真的挺很迷人的。 我喜欢文件的一点是,不管里面有什么,跟文件的交互方式总是一致的。我上面提到的那些东西——复制、排序、碎片整理——我可以对任何文件进行那些处理。文件可能是图像、游戏的一部分、也可能是我最喜欢的餐具清单。碎片整理程序不在乎它是什么。它不会去判断内容。

“符号数学”终于向“神经网络”屈服:AI 学会数学证明了?

你。 提交于 2020-08-08 14:01:04
云栖号资讯:【 点击查看更多行业资讯 】 在这里您可以找到不同行业的第一手的上云资讯,还在等什么,快来! 神译局是36氪旗下编译团队,关注科技、商业、职场、生活等领域,重点介绍国外的新技术、新观点、新风向。 编者按:众所周知,人工智能有两大流派。一是符号主义,另一个是联结主义。符号主义擅长逻辑演绎;联结主义擅长归纳总结,典型代表是机器学习。通常来说,演绎推理这种事情不是联结主义的菜。不过最近Facebook的一个AI小组却在这件事情上取得进展:让神经网络用语言翻译的原理去解微积分方程。这算是新突破吗?Stephen Ornes介绍了他们的成果,原文发表在quantamagazine.org上,标题是:Symbolic Mathematics Finally Yields to Neural Networks 划重点 大家把神经网络看作是AI的灵丹妙药,能够解决可以重述为模式识别问题的技术难题 困难的符号数学问题一直是神经网络的弱点 Facebook人工智能研究小组工作的计算机科学家,公开了第一个成功用神经网络解决符号数学问题的方案 他们将数学表达式转换为树状结构,然后训练网络在符号当中找到有关解的线索 这种方法可以充当数学家的助手,通过识别已知猜想中的模式为一个之前存在的问题提供帮助 更加令人兴奋的是,这种神经网络有可能帮助揭开神经网络本身黑匣子的秘密 通过将符号数学转换为树状结构

OCR场景文本识别:文字检测+文字识别

ε祈祈猫儿з 提交于 2020-05-06 02:38:32
一. 应用背景 OCR(Optical Character Recognition)文字识别技术的应用领域主要包括:证件识别、车牌识别、智慧医疗、pdf文档转换为Word、拍照识别、截图识别、网络图片识别、无人驾驶、无纸化办公、稿件编辑校对、物流分拣、舆情监控、文档检索、字幕识别文献资料检索等。OCR文字识别主要可以分为:印刷体文字识别和手写体文字识别。文字识别方法的一般流程为:识别出文字区域、对文字区域矩形分割成不同的字符、字符分类、识别出文字、后处理识别矫正。 二. 文字检测 文字检测是文字识别过程中的一个非常重要的环节,文字检测的主要目标是将图片中的文字区域位置检测出来,以便于进行后面的文字识别,只有找到了文本所在区域,才能对其内容进行识别。 1.【CTPN】 CTPN,全称是“Detecting Text in Natural Image with Connectionist Text Proposal Network”,将文本行在水平方向解耦成slices进行检测,再将slices区域合并成文本框。CTPN结构与Faster R-CNN类似,但加入了RNN(LSTM层)用于序列的特征识别来提高检测精度,目前CTPN针对水平长行文本的检测是工业级的,算法鲁棒。 算法流程: Feature Map:N(images) - C(channels) - H(height) - W