tom

Pandas | 11 字符串函数

て烟熏妆下的殇ゞ 提交于 2019-12-03 06:44:21
在本章中,我们将使用基本系列/索引来讨论字符串操作。在随后的章节中,将学习如何将这些字符串函数应用于数据帧( DataFrame )。 Pandas 提供了一组字符串函数,可以方便地对字符串数据进行操作。 最重要的是,这些函数忽略(或排除)丢失/NaN值。 几乎这些方法都使用Python字符串函数(请参阅: http://docs.python.org/3/library/stdtypes.html#string-methods )。 因此,将Series对象转换为String对象,然后执行该操作。 下面来看看每个操作的执行和说明。 编号 函数 描述 1 lower() 将 Series/Index 中的字符串转换为小写。 2 upper() 将 Series/Index 中的字符串转换为大写。 3 len() 计算字符串长度。 4 strip() 帮助从两侧的系列/索引中的每个字符串中删除空格(包括换行符)。 5 split(' ') 用给定的模式拆分每个字符串。 6 cat(sep=' ') 使用给定的分隔符连接系列/索引元素。 7 get_dummies() 返回具有单热编码值的数据帧(DataFrame)。 8 contains(pattern) 如果元素中包含子字符串,则返回每个元素的布尔值 True ,否则为 False 。 9 replace(a,b) 将值 a

Filter multiple conditions dplyr

匿名 (未验证) 提交于 2019-12-03 02:50:02
可以将文章内容翻译成中文,广告屏蔽插件可能会导致该功能失效(如失效,请关闭广告屏蔽插件后再试): 问题: I have a data.frame with character data in one of the columns. I would like to filter multiple options in the data.frame from the same column. Is there an easy way to do this that I'm missing? Example: data.frame name = dat days name 88 Lynn 11 Tom 2 Chris 5 Lisa 22 Kyla 1 Tom 222 Lynn 2 Lynn I'd like to filter out Tom and Lynn for example. When I do: target I get this error: longer object length is not a multiple of shorter object length 回答1: You need %in% instead of == : library(dplyr) target % filter(name %in% target) Produces days name 1

Tom Lee’s three reasons for a soaring of Bitcoin price

匿名 (未验证) 提交于 2019-12-03 00:19:01
On May 23th, Tom Lee, the co-founder of Fundstrat, said to CNBC in a email that the Bitcoin price will reach $25,000 for three reasons.However, before we really look into the reasons, it’s necessary for us to get a glimpse at the current price graph showing the data and how the Bitcoin price change. According to data from citicoins.com , the current price of Bitcoin stands at $7,449.36, far much lower than the so-called $25,000, and the curve seems rather volatile, with the high stood at more than $9,600, almost hitting the mark of $10,000 and the low at less than $7,500. It also shows a trend

Lucene查询语法详解

匿名 (未验证) 提交于 2019-12-02 23:43:01
2019独角兽企业重金招聘Python工程师标准>>> Lucene查询 Lucene查询语法以可读的方式书写,然后使用JavaCC进行词法转换,转换成机器可识别的查询。 下面着重介绍下Lucene支持的查询: Terms词语查询 词语搜索,支持 单词 和 语句。 单词,例如:"test","hello" 语句,例如:"hello,world!" 多个词语可以通过操作符,连接成更复杂的搜索逻辑。 Field字段查询 Lucene支持针对某个字段进行搜索,语法如: title:hello 或者 title:"hello title" 搜索语句时需要加上双引号,否则: title:hello title 就意味着,搜索title为hello,或者包含title关键字的文档 Term Modifier修饰符查询 Lucene支持对词语增加修饰,从而扩大查询的范围。 WildCard Searches通配符查询 支持在单个单词或者语句中添加通配符: ? 匹配单个字符 * 匹配0个或多个字符 例如: =>想要搜索test或者text te?t =>想要搜索test tests tester test* 文档中不支持通配符放在搜索的开头,如*test,但是在kibana中是支持这种搜索语法的。 Fuzzy Searches模糊词查询 支持搜索模糊词,如果想要搜索模糊词,需要在词语后面加上符号

Python自学--part2

牧云@^-^@ 提交于 2019-12-02 20:31:33
概要 列表、元组操作 字符串操作 字典操作 集合操作 文件操作 字符编码与转码 一、列表、元祖操作 列表是我们最以后最常用的数据类型之一,通过列表可以对数据实现最方便的存储、修改等操作 定义列表 1 names = ['Richard',"Tom",'Jack'] 通过下标访问列表中的元素,下标从0开始计数 1 >>> names[0] 2 'Richard' 3 >>> names[2] 4 'Jack' 5 >>> names[-1] 6 'Jack' 7 >>> names[-2] #还可以倒着取 8 'Tom' 切片:取多个元素 1 >>> names = ["Richard", "Tom", "Jack", "Rain", "Bob", "Amy"] 2 >>> names[1:4] #取下标1至下标4之间的数字,包括1,不包括4 3 ['Tom', 'Jack', 'Rain'] 4 >>> names[1:-1] #取下标1至-1的值,不包括-1 5 ['Tom', 'Jack', 'Rain', 'Bob'] 6 >>> names[0:3] 7 ['Richard', 'Tom', 'Jack'] 8 >>> names[:3] #如果是从头开始取,0可以忽略,跟上句效果一样 9 ['Richard', 'Tom', 'Jack'] 10 >>> names[3:

Pandas | 05 基本功能

我们两清 提交于 2019-12-02 19:58:28
到目前为止,我们了解了三种 Pandas 数据结构以及如何创建它们。接下来将主要关注数据帧(DataFrame)对象,因为它在实时数据处理中非常重要,并且还讨论其他数据结构。 一、系列基本功能 编号 属性或方法 描述 1 axes 返回行轴标签列表。 2 dtype 返回对象的数据类型( dtype )。 3 empty 如果系列为空,则返回 True 。 4 ndim 返回底层数据的维数,默认定义: 1 。 5 size 返回基础数据中的元素数。 6 values 将系列作为 ndarray 返回。 7 head() 返回前 n 行。 8 tail() 返回最后 n 行。 现在创建一个系列并演示如何使用上面所有列出的属性操作。 import pandas as pd import numpy as np s = pd.Series(np.random.randn(4)) print(s) 输出结果: 0 0.967853 1 -0.148368 2 -1.395906 3 -1.758394 dtype: float64 axes示例 import pandas as pd import numpy as np s = pd.Series(np.random.randn(4)) print ("The axes are:") print(s.axes) 输出结果: The

Pandas 入门

梦想的初衷 提交于 2019-12-02 02:51:06
Series 基本概念,创建 Series 一维数组 1 import numpy as np 2 import pandas as pd 3 4 s = pd.Series(np.random.rand(5)) 5 print(s) 6 print(type(s)) 7 # 是一个带有标签的一维数组,可以保存任何的数据类型(整数,字符串,浮点数,Python对象),轴标签,成为索引 index 8 print(s.index) 9 print(s.values, type(s.values)) 10 # series相比Ndarry,就是自带了一个索引 一维数组 + 对应的索引 11 # series 更像一个有顺序的字典 0 0.283000 1 0.808397 2 0.939227 3 0.628341 4 0.636434 dtype: float64 <class 'pandas.core.series.Series'> RangeIndex(start=0, stop=5, step=1) [0.28299992 0.80839728 0.93922677 0.62834058 0.63643368] <class 'numpy.ndarray'> 1 # 创建Series 2 # 方法一 ,由字典创建,字典的key就是index, values就是values 3

day2 数据及文件操作

时光总嘲笑我的痴心妄想 提交于 2019-12-01 19:33:28
1. 列表、元组操作 定义列表 names = ['felix','jack li','danie'] 通过下标访问列表中的元素,如 names[0] 切片:取多个元素 1 >>> names = ["felix","Tenglan","Eric","Rain","Tom","Amy"] 2 >>> names[1:4] #取下标1至下标4之间的数字,包括1,不包括4 3 ['Tenglan', 'Eric', 'Rain'] 4 >>> names[1:-1] #取下标1至-1的值,不包括-1 5 ['Tenglan', 'Eric', 'Rain', 'Tom'] 6 >>> names[0:3] 7 ['felix', 'Tenglan', 'Eric'] 8 >>> names[:3] #如果是从头开始取,0可以忽略,跟上句效果一样 9 ['felix', 'Tenglan', 'Eric'] 10 >>> names[3:] #如果想取最后一个,必须不能写-1,只能这么写 11 ['Rain', 'Tom', 'Amy'] 12 >>> names[3:-1] #这样-1就不会被包含了 13 ['Rain', 'Tom'] 14 >>> names[0::2] #后面的2是代表,每隔一个元素,就取一个 15 ['felix', 'Eric', 'Tom'] 16 >>>

Kotlin进阶之集合Map

主宰稳场 提交于 2019-12-01 16:52:47
Map是一种把键当做对象Key和值对象Value映射的集合 Kotlin的Map也分为可读的Map和可变的MutableMap Map没有继承于Collection接口 Map 1、创建Map Kotlin中的Map区分为可读的Map和可编辑的Map(MutableMap、HashMap、LinkedHashMap) a、mapOf 创建一个只读空Map 方式1: val map = mapOf<String,String>() 方式2: val map = emptyMap<String, String>() b、mapOf(pair: Pair ): Map ,> ,> 调用的是LinkedHashMap的构造函数 1 val map = mapOf<String,String>("tom" to "123","jack" to "123","mary" to "123") 其他的创造Map都差不多,下面是其他一些方法创造Map mutableMapOf(): MutableMap<K, V> = LinkedHashMap() mutableMapOf(vararg pairs: Pair<K, V>): MutableMap<K, V> = LinkedHashMap() hashMapOf(): HashMap<K, V> = HashMap () ,>

c编程练习(陕西科技大学mooc)

对着背影说爱祢 提交于 2019-12-01 07:03:27
1、投票 有三个候选人:TOM,ROSE,KATE,有20人投票选取一人做组长,编程完成投票计数功能。 输出人名和相应的得票数。 1 #include <stdio.h> 2 #include <string.h> 3 #define N 32 4 5 int main() 6 { 7 enum {TOM, ROSE, KATE}; 8 int tom=0, rose=0, kate=0; 9 10 const char *s[3] = {"TOM", "ROSE", "KATE"}; 11 char ts[N] =""; 12 13 int n=20; 14 while(n--) 15 { 16 gets(ts); 17 if(!strcmp(ts,s[TOM])) 18 tom++; 19 if(!strcmp(ts,s[ROSE])) 20 rose++; 21 if(!strcmp(ts,s[KATE])) 22 kate++; 23 } 24 25 printf("TOM=%d,ROSE=%d,KATE=%d",tom,rose,kate); 26 27 return 0; 28 } 来源: https://www.cnblogs.com/GoldenEllipsis/p/11666048.html