换行符

. 正则表达式规则

我与影子孤独终老i 提交于 2020-02-07 03:57:11
http://blog.csdn.net/zaifendou/article/details/5746988 1. 正则表达式规则 1.1 普通字符 字母、数字、汉字、下划线、以及后边章节中没有特殊定义的标点符号,都是"普通字符"。表达式中的普通字符,在匹配一个字符串的时候,匹配与之相同的一个字符。 举例1:表达式 "c",在匹配字符串 "abcde" 时 ,匹配结果是:成功;匹配到的内容是:"c";匹配到的位置是:开始于2,结束于3。(注:下标从0开始还是从1开始,因当前编程语言的不同而可能不同) 举例2:表达式 "bcd",在匹配字符串 "abcde" 时 ,匹配结果是:成功;匹配到的内容是:"bcd";匹配到的位置是:开始于1,结束于4。 1.2 简单的转义字符 一些不便书写的字符,采用在前面加 "/" 的方法。这些字符其实我们都已经熟知了。 表达式 可匹配 /r, /n 代表回车和换行符 /t 制表符 // 代表 "/" 本身 还有其他一些在后边章节中有特殊用处的标点符号,在前面加 "/" 后,就代表该符号本身。比如:^, $ 都有特殊意义,如果要想匹配字符串中 "^" 和 "$" 字符,则表达式就需要写成 "/^" 和 "/$"。 表达式 可匹配 /^ 匹配 ^ 符号本身 /$ 匹配 $ 符号本身 /. 匹配小数点(.)本身 这些转义字符的匹配方法与 "普通字符"

js中去除两端逗号

佐手、 提交于 2020-02-06 23:02:25
js中去除两端逗号 1.js replace(a,b)之替换字符串中所有指定字符的方法 1 2 3 4 5 6 7 8 9 10 var str = 'abcadeacf' ; var str1 = str.replace( 'a' , 'o' ); alert(str1); // 打印结果: obcadeacf var str2 = str.replace(/a/g, 'o' ); alert(str2); //打印结果: obcodeocf, 注意: 此处replace的第一个参数为正则表达式,/g是全文匹配标识。 2. JS四种方法去除字符串最后的逗号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 <script> window.onload= function () { var obj = {name: "xxx" , age: 30, sex: "female" }; //定义一个object对象 var str = '' //定义一个空字符用来接收对象里的key或者value for ( var item in obj) { //遍历item变量里的对象的属性和元素, str += obj[item] + "," //将obj对象的值遍历出来,并且追加到str字符中。 //str +=

python金融大数据挖掘与分析——新闻数据挖掘

落花浮王杯 提交于 2020-01-30 23:46:48
文章目录 1. 提取百度新闻标题、网址、日期及来源 1.1 获取网页源代码 1.2 编写正则表达式提取新闻信息 1.2.1 提取新闻的来源和日期 1.2.2 提取新闻的网址和标题。 1.2.3 数据清洗 2. 批量获取多家公司的百度新闻并生成数据报告 2.1 批量爬取多家公司的百度新闻 2.2 自动生成舆情数据报告文本文件 3. 异常处理及24小时实时数据挖掘实战 3.1 异常处理 3.2 24小时实时爬取 4. 按时间顺序爬取及批量爬取多页内容 4.1 按时间顺序爬取百度新闻 4.2 一次性批量爬取多页内容 5. 搜狗新闻与新浪财经数据挖掘实战 5.1 搜狗新闻数据爬取 1. 提取百度新闻标题、网址、日期及来源 1.1 获取网页源代码 我们通过如下代码可以获取网页源代码,示例中代码是获取在百度新闻中搜索阿里巴巴的网页源代码。 import requests headers = { 'User-Agent' : 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) ' 'AppleWebKit/537.36 (KHTML, like Gecko) ' 'Chrome/77.0.3865.120 Safari/537.36' } res = requests . get ( url , headers = headers ) web_text =

除非换行符在格式字符串中,否则为什么在调用后printf不会刷新?

醉酒当歌 提交于 2020-01-25 09:33:57
除非换行符在格式字符串中,否则为什么在调用后 printf 不会刷新? 这是POSIX行为吗? 每次如何立即使 printf 刷新? #1楼 stdout已缓冲,因此仅在换行符输出后输出。 要立即获得输出,请执行以下任一操作: 打印到stderr。 使stdout无缓冲。 #2楼 要立即刷新,请调用 f flush (stdout) 或 fflush(NULL) ( NULL 表示刷新所有内容)。 #3楼 您可以使用fprintf到没有缓冲的stderr。 或者,您可以在需要时刷新标准输出。 或者,您可以将stdout设置为unbuffered。 #4楼 默认情况下, stdout 流是行缓冲的,因此仅在到达换行符后(或被告知时)才显示缓冲区中的内容。 您有几种选择可以立即打印: 打印到 stderr 而不是使用 fprintf ( 默认情况下 stderr 是未 缓冲的 ): fprintf(stderr, "I will be printed immediately"); 在需要使用 fflush 时冲洗stdout: printf("Buffered, will be flushed"); fflush(stdout); // Will now print everything in the stdout buffer 编辑 :从下面的安迪·罗斯的评论,您还可以通过使用

Linux去除特殊符号^M

三世轮回 提交于 2020-01-24 10:44:19
问题解决方法: 步骤一:使用vim进入要修改的文件 步骤二:执行命令%s/^M/\r/g后可把特殊符号^M替换成Linux正常换行符 注意:^M用Ctrl+v和Ctrl+m打出来 问题原因: 原因是Windows和Linux系统的编码格式不同 Windows默认编码:GBK,换行符:/r/n Linux默认编码:UTF-8,换行符:/n 两个系统的换行符不统一,Linux未正常识别/r/n,出现特殊符号^M 来源: CSDN 作者: 男孩@ 链接: https://blog.csdn.net/weixin_38203279/article/details/103949784

设置IDEA的text file encoding为 UTF-8、文件的换行符使用 Unix 格式

折月煮酒 提交于 2020-01-22 09:22:02
阿里巴巴Java开发手册,强制要求IDE 的 text file encoding 设置为 UTF-8; IDE 中文件的换行符使用 Unix 格式,不要使用 Windows 格式。 原因: 在各操作系统下,文本文件所使用的换行符是不一样的。UNIX/Linux 使用的是 0x0A(LF),早期的 Mac OS 使用的是0x0D(CR),后来的 OS X 在更换内核后与 UNIX 保持一致了。但 DOS/Windows 一直使用 0x0D0A(CRLF)作为换行符。 这种不统一确实对跨平台的文件交换带来麻烦。虽然靠谱的文本编辑器和 IDE 都支持这几种换行符,但文件在保存时总要有一个固定的标准啊,比如跨平台协作的项目源码,到底保存为哪种风格的换行符呢? Git 作为一个源码版本控制系统,对这个问题提供了一个“解决方案”。Git 由大名鼎鼎的 Linus 开发,最初只可运行于 *nix 系统,因此推荐只将 UNIX 风格的换行符保存入库。但它也考虑到跨平台协作的场景,并且提供了一个“换行符自动转换”功能。 这个功能默认处于“自动模式”,当你在签出文件时,它试图将 UNIX 换行符(LF)替换为 Windows 的换行符(CRLF);当你在提交文件时,它又试图将 CRLF 替换为 LF。 Git 的“换行符自动转换”功能听起来似乎很智能、很贴心,因为它试图一方面保持仓库内文件的一致性

SQL清空换行符和回车符

大兔子大兔子 提交于 2020-01-15 09:43:16
用了EXCEL导入数据到SQL SERVER之后系统数据显示正常,最近数据导出遇到了问题,发现数据中有大量换行符导致导出失败。 比较常出现的几个字符:char(9)\t 制表符;char(10)\r换行符;char(13)回车符。 可以使用replace把字段中的特殊字符替换为空。 UPDATE company SET title = REPLACE(title, char(9),'') UPDATE company SET title = REPLACE(title, char(9),'') UPDATE company SET title = REPLACE(title, char(9),'') 来源: CSDN 作者: 不知12 链接: https://blog.csdn.net/qq_41356488/article/details/103879192

shell错误 sed: can't read : No such file or directory

送分小仙女□ 提交于 2020-01-11 00:32:31
出现这样的问题主要是在于 空字符 造成的,情况分为3种 第一种是windows上的文件 ,在Linux上运行,这种可以通过查看文件编码确认,unix + utf-8 可以解决。 第二种是网页复制的shell代码 ,里边有些未知编码的空格字符,这种情况多次全局替换,可以解决,实在不行照着代码敲一遍总可以解决。 第三种是 sed命令使用了换行符 \ 且在换行符后加入了空格 ,例如: value1=test1 value2=test2 sed -i -r \ -e "s/(key1[ =]*).*/\1${value1}/g" \ -e "s/(key2[ =]*).*/\1${value2}/g" \ /root/test.conf 这是一个修改配置文件的脚本,但是在倒数第二行的\后边有空格,续行符后的空格在这里被解释为了文件路径,所以找不到文件。 来源: CSDN 作者: whatday 链接: https://blog.csdn.net/whatday/article/details/103924766

python字符串(string)方法整理

馋奶兔 提交于 2020-01-10 23:36:45
目录 1.大小写转换 1.1 lower、upper 1.2 title、capitalize 1.3 swapcase 2.isXXX判断 2.1 isalpha,isdecimal,isdigit,isnumeric,isalnum 2.2 islower,isupper,istitle 2.3 isspace,isprintable,isidentifier 3.填充 3.1 center 3.2 ljust和rjust 3.3 zfill 4.子串搜索 4.1 count 4.2 endswith和startswith 4.3 find,rfind和index,rindex 5.替换 5.1 replace 5.2 expandtabs 5.3 translate和maketrans 6.分割 6.1 partition和rpartition 6.2 split、rsplit和splitlines 7.join 8.修剪:strip、lstrip和rstrip print(dir(str)) [..........'capitalize', 'casefold', 'center', 'count', 'encode', 'endswith', 'expandtabs', 'find', 'format', 'format_map', 'index', 'isalnum',

Sql server bulk insert

那年仲夏 提交于 2020-01-07 05:06:41
Sql server bulk insert Bulk Insert Sql server 的bulk insert语句可以高效的导入大数据量的平面文件(txt,csv文件)到数据库的一张表中,其用法如下: bulk insert test from 'f:\test.txt' with (fieldterminator=',', rowterminator='\n') 其中"test"是数据库表的名字,"f:\test.txt"是导入平面文件的地址,fieldterminator指定平面文件中列的分隔符是什么,rowterminator指定平面文件中行的结束符是什么。 还可以使用FIRSTROW和LASTROW限制行数。如下COPY前三行: bulk insert test from 'f:\test.txt' with (fieldterminator=',', rowterminator='\n', FIRSTROW =1, LASTROW=3) 要把平面文件数据导入到数据库表中,平面文件只有3个字段,数据库表有7个字段, 怎么把平面文件字段的对应到表的字段,如何用bulk insert来实现? 数据库表 userinfo CREATE TABLE userinfo ( id INT identity, userName varchar(20), pass varchar