le

DataSet in Machine Learning

梦想与她 提交于 2020-03-08 15:02:15
一、UCI   Wine dataset: https://archive.ics.uci.edu/ml/datasets/Wine ,包含178个样本,每个样本包含13个与酒的化学特性的特征,标签有1,2,3,代表意大利不同地区生长的三种类型的葡萄   Breast Cancer Wisconsin dataset: https://archive.ics.uci.edu/ml/datasets/Breast+Cancer+Wisconsin+(Diagnostic) , 包含569个样本,每个样本是良性或者恶性癌细胞,M代表恶性,B代表良性,并且每个样本还有30个特征,可以用来构建模型预测样本是恶性还是良性。 import pandas as pd df = pd.read_csv('https://archive.ics.uci.edu/ml/machine-learning-databases/breast-cancer-wisconsin/wdbc.data', header=None) from sklearn.preprocessing import LabelEncoder X = df.loc[:, 2:].values y = df.loc[:, 1].values le = LabelEncoder() y = le.fit_transform(y) le

EOJ#3686 回文串

孤街浪徒 提交于 2020-03-07 22:07:40
单点时限: 2.0 sec 内存限制: 512 MB QQ小方前不会判断回文数列,现在他会了,所以他急切的想教会你。 回文数列指的是一个正读和反读都一样的数列,比如 “1 2 3 2 1” 和 “1 2 2 1”。 单单讲给你听肯定是不够的,为了表现自己,QQ 小方现在要考考你。 现在 QQ 小方会给你 n 个数组成的数列 a1,a2,⋯,an。他每次操作允许你合并其中相邻的两个数 ai 和 ai+1 (i<n),合并以后的两个数留在原来的位置(两个数合并以后只会留下一个数),但会变成 ai+ai+1。QQ 小方想知道最少需要几次这样的操作,这个数列就会变成回文数列。 输入格式 输入包含两行,第一行一个整数 n (1≤n≤10^6),表示数列的长度。 第二行包含 n 个用空格隔开的数 a1,a2,⋯,an (0≤ai≤10^9),表示数列。 输出格式 输出包含一个整数,表示最少的操作次数 样例 input1 3 1 2 3 output1 1 input2 3 1 2 4 output2 2 input3 3 3 3 3 output3 0 提示 对于样例一:只需要一步,即合并前两个。 对于样例二:只有合并成一个数的时候,才满足回文数列的要求,所以需要两步。 对于样例三:本身就是一个回文数列,不需要合并操作。 这个题我第一眼看上去就很懵逼,第一反应是区间DP,但是n<=10^6

PyQt5_QLineEdit_光标使用

↘锁芯ラ 提交于 2020-02-03 20:44:48
from PyQt5 . Qt import * class MyWindow ( QWidget ) : def __init__ ( self ) : super ( ) . __init__ ( ) self . setWindowTitle ( '光标使用' ) self . resize ( 500 , 500 ) self . iniUI ( ) def iniUI ( self ) : le = QLineEdit ( self ) le . resize ( 280 , 50 ) le . setStyleSheet ( 'font-size:40px' ) le . move ( ( self . width ( ) - le . width ( ) ) / 2 , ( self . height ( ) - le . height ( ) ) / 2 ) btn = QPushButton ( self ) btn . setText ( '光标操作按钮' ) btn . resize ( 200 , 50 ) btn . move ( ( self . width ( ) - btn . width ( ) ) / 2 , ( self . height ( ) - 3 * btn . height ( ) ) ) ######################

sklearn 分类转换为分类数值

☆樱花仙子☆ 提交于 2020-01-18 08:08:49
preprocessing.LabelEncoder 标签专用,能够将分类转换为分类数值 preprocessing.OrdinalEncoder 特征专用,能够将分类特征转换为分类数值 将原本的Sex,原本为male与female,现在将这两个数据转换为0和1 。 原本的Embarked,不同的舱位,有SCQ三种,现在可以转换为0、1、2 。 Servived有Yes、No、Unknown,转换为0、1、2 。 import pandas as pd data = pd . read_csv ( r "C:\Users\JYuXuAN\Desktop\sklearn\预处理数据\Narrativedata.csv" , index_col = 0 ) # 防止多索引 # print(data.info()) # print() Age = data . loc [ : , "Age" ] . values . reshape ( - 1 , 1 ) # sklearn当中特征矩阵必须是二维 Age [ : 20 ] # print(Age[:20]) #前20行用作展示,实际上把所有的缺失值使用中位数填充 from sklearn . impute import SimpleImputer imp_mean = SimpleImputer ( ) # 实例化,默认用均值填补

【luogu3371】【图论】【最短路】【模板】单源最短路径(弱化版)

别来无恙 提交于 2020-01-16 08:11:02
题目背景 本题测试数据为随机数据,在考试中可能会出现构造数据让SPFA不通过,如有需要请移步 P4779。 题目描述 如题,给出一个有向图,请输出从某一点出发到所有点的最短路径长度。 输入格式 第一行包含三个整数 n,m,sn,m,sn,m,s,分别表示点的个数、有向边的个数、出发点的编号。 接下来 mmm 行每行包含三个整数 u,v,wu,v,wu,v,w,表示一条 u→vu \to vu→v 的,长度为 www 的边。 输出格式 输出一行 nnn 个整数,第 iii 个表示 sss 到第 iii 个点的最短路径,若不能到达则输出 231−12^{31}-1231−1。 输入输出样例 输入 #1 4 6 1 1 2 2 2 3 2 2 4 1 1 3 5 3 4 3 1 4 4 输出 #1 0 2 4 3 说明/提示 【数据范围】 对于 20%20%20% 的数据:1≤n≤51\le n \le 51≤n≤5,1≤m≤151\le m \le 151≤m≤15; 对于 40%40%40% 的数据:1≤n≤1001\le n \le 1001≤n≤100,1≤m≤1041\le m \le 10^41≤m≤104; 对于 70%70%70% 的数据:1≤m≤10001\le m \le 10001≤m≤1000,1≤m≤1051\le m \le 10^51≤m≤105; 对于

【BZOJ】3922: Karin的弹幕

こ雲淡風輕ζ 提交于 2019-12-25 19:07:54
题意 给定一个长度为 \(n(1 \le n \le 70000)\) 序列, \(m(1 \le m \le 70000)\) 次操作:1. 对一段下标是等差数列的子序列求最大值;2. 单点修改。 分析 如果公差很大,那么速度是很快的。所以我们考虑阈值。 题解 设阈值 \(k\) 表示如果询问的公差小于等于 \(k\) 则用线段树求,否则暴力。 则我们对阈值每一个公差 \(i(1 \le i \le k)\) 建 \(i\) 棵线段树。 复杂度 \(O(kn + m(\frac{n}{k} + log n))\) #include <bits/stdc++.h> using namespace std; const int N=70005, MXD=10, oo=(~0u>>1)+1; int a[N], D, sz[MXD+1][MXD+1], b[N]; struct node *null; struct node { node *c[2]; int mx; node() { c[0]=c[1]=0; mx=oo; } void up() { mx=max(c[0]->mx, c[1]->mx); } }Po[10000005], *iT=Po, *root[MXD+1][MXD+1]; node *newnode() { return iT++; } node* build

@codeforces - 407E@ k-d-sequence

十年热恋 提交于 2019-12-11 09:42:28
目录 @description@ @solution@ @accepted code@ @details@ @description@ 我们称一个序列是 k-d 的,当且仅当我们可以加入最多 k 个数,然后将序列排序,最终得到的序列是等差的且公差为 d。 给定一个序列 a,求 a 中的一个最长子区间,使得该子区间是 k-d 的。 1 ≤ n ≤ 2·10^5; 0 ≤ k ≤ 2·10^5; 0 ≤ d ≤ 10^9; -10^9 ≤ ai ≤ 10^9。 原题戳这里 @solution@ 先特判 d = 0 的情况:找最长连续相同的段。 假如一个区间能够加入若干数使其满足条件,则这个区间内的所有数 mod d 应相等。其次,这个区间还应满足任意两个数互不相等。 可以求出每一个点 i 作为右端点,满足以上两个条件的左端点最远到 le[i]。 对于满足以上两个条件的区间,我们尝试去求所需要加入的数最少为多少。 求出该区间 [l, r] 的 max 与 min,则 (max - min) / d 为它的最少项数。现在已经有 r - l + 1 项,则最少需要 (max - min) / d - (r - l + 1) 项。 注意 (max - min) / d 可以写成 (max - max mod d) / d - (min - min mod d) / d。 扫描右端点

计蒜客2019CSP膜你赛第一场

时间秒杀一切 提交于 2019-12-03 21:31:48
计蒜客2019CSP比赛第一场 巧妙避开这场比赛…… T1炮击 题目描述 \(rize\) 是一个可爱的女孩子。 一天, \(rize\) 进行了炮击的练习。炮击用的靶子为一个圆,其中有 \(n-1\) 个与靶子同心的圆,将靶子划分成了 \(n\) 个区域。这些区域里到外从 \(1\) 到 \(n\) 编号,第 \(i\) 个区域的外径为 \(R_i\) 。每个区域有一个分数,第 \(i\) 个区域的分数为 \(s_i\) 。 \(rize\) 发射了 \(m\) 枚炮弹。在靶平面上的以靶心为原点的直角坐标系下,第 \(i\) 枚炮弹击中的区域为一个半径为 \(r_i\) 的圆,其圆心的坐标为 \((x_i, y_i)\) 。若一枚炮弹击中的区域与靶子中的某个区域存在交集,则发射这枚炮弹会得到这个区域的分数。这里的区域不包含边界。 \(rize\) 想知道发射每一枚炮弹的得分。 输入格式 第一行两个数 \(n, m\) ; 之后 \(n\) 行,每行两个整数 \(R_i, s_i\) ; 之后 \(m\) 行,每行三个整数 \(x_i, y_i, r_i\) 。 输出格式 \(m\) 行,每行一个数表示答案。 数据范围 有 \(30\%\) 的数据 \(n, m \le 1000\) ; 另有 \(20\%\) 的数据 \(r_i = 1\) ; 另有 \(20\%\) 的数据 \

Reverse Label Encoding giving error

匿名 (未验证) 提交于 2019-12-03 01:34:02
可以将文章内容翻译成中文,广告屏蔽插件可能会导致该功能失效(如失效,请关闭广告屏蔽插件后再试): 由 翻译 强力驱动 问题: I label encoded my categorical data into numerical data using label encoder data [ 'Resi' ] = LabelEncoder (). fit_transform ( data [ 'Resi' ]) But I when I try to find how they are mapped internally using list ( LabelEncoder . inverse_transform ( data [ 'Resi' ])) I am getting below error TypeError Traceback ( most recent call last ) < ipython - input - 67 - 419ab6db89e2 > in <module> () ----> 1 list ( LabelEncoder . inverse_transform ( data [ 'Resi' ])) TypeError : inverse_transform () missing 1 required positional argument : 'y'

BZOJ2716[Violet] 天使玩偶/SJY摆棋子

匿名 (未验证) 提交于 2019-12-03 00:22:01
原题链接: https://www.lydsy.com/JudgeOnline/problem.php?id=2716 Ayu 在七年前曾经收到过一个天使玩偶,当时她把它当作时间囊埋在了地下。而七年后 的今天,Ayu 却忘了她把天使玩偶埋在了哪里,所以她决定仅凭一点模糊的记忆来寻找它。 我们把 Ayu 生活的小镇看作一个二维平面坐标系,而 Ayu 会不定时地记起可能在某个点 (xmy) 埋下了天使玩偶;或者 Ayu 会询问你,假如她在 (x,y) ,那么她离近的天使玩偶可能埋下的地方有多远。 因为 Ayu 只会沿着平行坐标轴的方向来行动,所以在这个问题里我们定义两个点之间的距离为dist(A,B)=|Ax-Bx|+|Ay-By|。其中 Ax 表示点 A的横坐标,其余类似。 第一行包含两个整数n和m ,在刚开始时,Ayu 已经知道有n个点可能埋着天使玩偶, 接下来 Ayu 要进行m 次操作 接下来n行,每行两个非负整数 (xi,yi),表示初始n个点的坐标。 再接下来m 行,每行三个非负整数 t,xi,yi。 如果t=1 ,则表示 Ayu 又回忆起了一个可能埋着玩偶的点 (xi,yi) 。 如果t=2 ,则表示 Ayu 询问如果她在点 (xi,yi) ,那么在已经回忆出来的点里,离她近的那个点有多远 对于每个t=2 的询问,在单独的一行内输出该询问的结果。 2 3 1 1 2 3 2