retext

中英文1:2等宽字体

只谈情不闲聊 提交于 2020-11-21 12:04:45
折腾了半天字体。 起因是在linux下用ReText写rst格式文档,写标题的时候报错文字下的标记长度不够,明明是对对齐的。原因是中英文字体不是严格1:2等宽,1个中文字宽度不等于2个英文字宽度,造成错觉。换了几个等宽字体也不行。 搜索折腾了一番。总结如下: 最简单实用的办法是安装一个为中文优化过的等宽英文字体,设置字体时就选这个等宽英文字体。这种字体不多,例如:ubuntu mono。据说还有mplus fonts,应该是含有中日文的,没试过。 gnome terminal和vim,gvim有特殊处理,不用安装特殊字体,自动中英文1:2等宽。 Windos 7下,我记得有款达人自制的雅黑Consolas混合字体,挺棒的。中英文看起来都比较舒服。至于是不是中英文1:2等宽,有段时间没用Windows 7,不太记得了。 Windows 10下,看程序心情。 正常程序notepad, notepad++, 选择普通的等宽英文字体,自动中英文1:2等宽。 自制雅黑Consolas混合字体,不再中英文1:2等宽。 较高版本的Visual Studio 2012, 2017、SQL Server Management Studio 2017, 字体不会自动等宽。进入抽风模式 原本包含1:2等宽中英文的字体,如“新宋体”,能保持中英文1:2等宽 ubuntu mono,设置12号字体

12种自然语言处理的开源工具

倾然丶 夕夏残阳落幕 提交于 2020-02-26 07:29:05
让我们看看可以用在你自己的 NLP 应用中的十几个工具吧。 在过去的几年里,自然语言处理(NLP)推动了聊天机器人、语音助手、文本预测等这些渗透到我们的日常生活中的语音或文本应用程技术的发展。目前有着各种各样开源的 NLP 工具,所以我决定调查一下当前开源的 NLP 工具来帮助你制定开发下一个基于语音或文本的应用程序的计划。 尽管我并不熟悉所有工具,但我将从我所熟悉的编程语言出发来介绍这些工具(对于我不熟悉的语言,我无法找到大量的工具)。也就是说,出于各种原因,我排除了三种我熟悉的语言之外的工具。 R 语言可能是没有被包含在内的最重要的语言,因为我发现的大多数库都有一年多没有更新了。这并不一定意味着它们没有得到很好的维护,但我认为它们应该得到更多的更新,以便和同一领域的其他工具竞争。我还选择了最有可能用在生产场景中的语言和工具(而不是在学术界和研究中使用),而我主要是使用 R 作为研究和发现工具。 我也惊讶地发现 Scala 的很多库都没有更新了。我上次使用 Scala 已经过去了两年了,当时它非常流行。但是大多数库从那个时候就再没有更新过,或者只有少数一些有更新。 最后,我排除了 C++。 这主要是因为我上次使用 C++ 编写程序已经有很多年了,而我所工作的组织还没有将 C++ 用于 NLP 或任何数据科学方面的工作。 Python 工具 自然语言工具包(NLTK) 毋庸置疑,

Ubuntu 下的实用工具(持续更新)

大城市里の小女人 提交于 2019-12-03 03:32:37
最近正式将工作环境从 Windows 转到 Ubuntu 上来,有很多的不适应.各种工具神马的是最头疼的,很多在 Windows 下用的很爽的工具在 Ubuntu 下并不能使用.这篇文章将记录我在使用 Ubuntu 的过程中发现的好用的工具,一是给自己做一个备份,二是给大家提供一个参考。 文本文件编码转换工具: enca 安装: $sudo apt-get install enca 命令格式: $enca -L 当前语言 -x 目标编码 文件名 例如,例如要把当前目录下的所有文件都转成utf-8: $enca -L zh_CN -x utf-8 * MarkDown编辑器: ReText ReText 是一个使用 Markdown 语法和 reStructuredText (reST) 结构的文本编辑器,编辑的内容支持导出到 PDF、ODT 和 HTML 以及纯文本,支持即时预览、网页生成以及 HTML 语法高亮、全屏模式,可导出文件到 Google Docs 等。 本文将持续更新 来源: oschina 链接: https://my.oschina.net/u/252629/blog/143002