lr

【论文笔记】Evaluation of Hierarchical Clustering Algorithms for Document Datasets

落花浮王杯 提交于 2020-02-26 00:13:03
导读 这篇文章感觉挺有意思,2002年CIKM的文章。 在我的todo list里面虽然已经一个月了,但是之前主要是奔着他的 hierarchy evaluation来的,现在看看其实他主要的contribution是大量的实验+自己提出的constrained agglomerative algorithms (话说做hierarchy clustering evaluation的人真少啊,我找了非常久,来来去去就那么几篇好点的文章。自己思考做这个方向的人少是因为: 1 聚类算法本身无监督,特别难以定论在所有的情况下都是这个算法好。 2 很少有人本身就是做聚类算法改进的,毕竟要实验需要在不同的人物上做大量的实验。图片聚类、文本聚类、人物画像 聚类等等。数据集大小又因人而异。 3 大部分都聚类也不是很需要层次聚类(你看我上面举的三个例子,跟层级没有一定的联系吧… 这三个理由互成因果。没什么需求导致小方向,小方向又导致没什么新鲜血液来研究。 doc-level聚类这个任务我之前没有做过,但是光从文档这个级别上来思考,可操作的特征非常多,会比我们自己做的任务要简单。毕竟我们是sentence level的。 Abstract 主要说在 文档分类 这个任务下 比较了大量的 agglomerative 和 partitional 两类hierarchy聚类算法

Loadrunner中对中文进行UTF-8转码的探索

南笙酒味 提交于 2020-02-25 18:14:11
上一篇 / 下一篇 2010-02-22 15:20:28 查看( 2378 ) / 评论( 2 ) / 评分( 5 / 0 ) 这是一个 HTTP 接口 测试 中经常会碰到的问题,目前的服务器采用的都是UTF-8编码方式,而我们的客户机 Windows 系统一般默认采用的编码方式是GBK,这正是我们采用录制方式的时候会发现许多中文 乱码 的原因。 Loadrunner 录 制的时候可以通过在Virtual User Gen的Tools->Recoding Options -> Advanced -> Support charset -> UTF-8的设置规避(其实也只是部分规避),下面我们讨论在手写测试脚本时如何解决UTF-8转码的问题。 实践一:在脚本中直接采用中文明文进行请求 web_custom_request("web_custom_request", "URL=http://172.16.4.191/list?id=环球影院", "Method=GET", "TargetFrame=", "Resource=0", "Referer=", "Body=", LAST); 结果:服务端返回404错误,找不到相应的资源id,明显服务端不能正确响应非UTF8编码方式的请求。 实践二: 为解决这个问题,最关键的是要把本地GBK编码的汉字转换成UTF-8编码格式的信息

细品 - 逻辑回归(LR)*

旧巷老猫 提交于 2020-02-25 16:06:03
1. LR的直观表述 1.1 直观表述   今天我们来深入了解一个工业界应用最多,虽然思想简单但也遮挡不住它NB光芒的绽放的一个 分类 预测模型,它就是LR模型。 LR模型可以被认为就是一个被Sigmoid函数(logistic方程)所归一化后的线性回归模型 !为啥这么说呢?我们来看一下它的假设函数的样子:      首先来解释一下 的表示的是啥?它表示的就是将因变量预测成1(阳性)的概率,具体来说它所要表达的是在给定x条件下事件y发生的条件概率,而 是该条件概率的参数。看到这个公式可能一脸懵逼,那我们将它分解一下:      很容易看出将(1)代入到(2)中是不是就得到了LR模型的假设函数啦。(1)式就是我们介绍的 线性回归的假设函数 ,那(2)式就是我们的Sigmoid函数啦。什么?为什么会用Sigmoid函数?因为它引入了非线性映射,将线性回归 值域映射到0-1之间,有助于直观的做出预测类型的判断:大于等于0.5表示阳性,小于0.5表示阴性。 其实,从本质来说:在分类情况下,经过学习后的LR分类器其实就是一组权值 ,当有测试样本输入时,这组权值与测试数据按照加权得到    这里的 就是每个测试样本的n个特征值。之后在按照Sigmoid函数的形式求出 ,从而去判断每个测试样本所属的类别。 由此看见, LR模型学习最关键的问题就是研究如何求解这组权值! 1.2 决策边界  

loadrunner函数

ぐ巨炮叔叔 提交于 2020-02-24 09:45:27
lr_start_transaction 为性能分析标记事务的开始 lr_end_transaction 为性能分析标记事务的结束 lr_rendezvous 在 Vuser 脚本中设置集合点 lr_think_time 暂停 Vuser 脚本中命令之间的执行 lr_end_sub_transaction 标记子事务的结束以便进行性能分析 lr_end_transaction 标记 LoadRunner 事务的结束 Lr_end_transaction("trans1",Lr_auto); lr_end_transaction_instance 标记事务实例的结束以便进行性能分析lr_fail_trans_with_error 将打开事务的状态设置为 LR_FAIL 并发送错误消息 lr_get_trans_instance_duration 获取事务实例的持续时间(由它的句柄指定) lr_get_trans_instance_wasted_time 获取事务实例浪费的时间(由它的句柄指定) lr_get_transaction_duration 获取事务的持续时间(按事务的名称) lr_get_transaction_think_time 获取事务的思考时间(按事务的名称) lr_get_transaction_wasted_time 获取事务浪费的时间(按事务的名称) lr

LoadRunner常用函数列表

回眸只為那壹抹淺笑 提交于 2020-02-24 08:52:15
LoadRunner常用函数列表 Web 相关函数 函 数 功 能 描 述 web_custom_request 用户可以通过该函数自行创建一个 HTTP 请求 的 函数 web_image 模拟用户单击图片操作 的 函数 web_link 模拟用户单击指定属性链接操作 的 函数 web_submit_data 执行“无状态“或“内容无关”提交数据操作 的 函数 web_submit_form 模拟表单数据提交操作函数 web_url 模拟访问一个指定网址资源 的 函数 web_find 在 HTML 页面查找指定的文本字符串 的 函数 web_global_verification 查找指定的文本在所有后续请求 的 函数 web_image_check 检查在 HTML 页面中是否存在指定的图片 的 函数 web_reg_add_cookie 注册一个指定的文本字符串,如果查找到文本将存储到 Cookie 中 的 函数 web_reg_find 注册一个在下一个动作查找指定字符串 的 函数 web_create_html_param 将指定动态数据存储在指定参数的函数 web_create_html_param_ex 将指定动态数据存储在指定参数的扩展的函数 web_reg_save_param 存储非空结束动态数据到指定参数的函数 web_save_param_length

Loadrunner中对中文进行UTF-8转码

余生长醉 提交于 2020-02-24 08:36:59
这是一个 HTTP 接口 测试 中经常会碰到的问题,目前的服务器采用的都是UTF-8编码方式,而我们的客户机 Windows 系统一般默认采用的编码方式是GBK,这正是我们采用录制方式的时候会发现许多中文 乱码 的原因。 Loadrunner 录制的时候可以通过在Virtual User Gen的Tools->Recoding Options -> Advanced -> Support charset -> UTF-8的设置规避(其实也只是部分规避),下面我们讨论在手写测试脚本时如何解决UTF-8转码的问题。 实践一:在脚本中直接采用中文明文进行请求 web_custom_request("web_custom_request", "URL=http://172.16.4.191/list?id=环球影院", "Method=GET", "TargetFrame=", "Resource=0", "Referer=", "Body=", LAST); 结果:服务端返回404错误,找不到相应的资源id,明显服务端不能正确响应非UTF8编码方式的请求。 实践二: 为解决这个问题,最关键的是要把本地GBK编码的汉字转换成UTF-8编码格式的信息,为此我们引进loadrunner自带的编码函数 lr_convert_string_encoding lr_convert_string

提交json串格式的POST请求

大憨熊 提交于 2020-02-24 04:31:33
提交json串格式的POST请求 Action() { web_reg_save_param("retCode", "LB=retCode\":\"", "RB=\"", "NotFound=WARNING", LAST); lr_start_transaction("test"); web_add_header("Content-Type" ,"application/json"); web_custom_request("test", "URL=http://127.0.0.1/test ", "Method=POST", "Resource=0", "Referer=", "Mode=HTTP", "EncType=application/json; charset=UTF-8", "RecContentType=application/json", "Body={\"channelNo\":\"{channelNo}\",\" phoneno \":12345678900,\"createdTime\":\"{createdTime}\"}", LAST); if (!strcmp(lr_eval_string("{retCode}"),"000000")) { lr_output_message("Successfull, retcode is:%s", lr_eval

乱码问题

早过忘川 提交于 2020-02-24 03:48:26
我用 loadrunner 录制,脚本里的乱码一直没有解决。看到网上很多贴子。 采用的方法:1、第一步:去lr 的vugen的Tools -> Recoding Options -> Advanced -> Support charset -> UTF-8 选上。 2、新建脚本--->选择协议(Http)-->选项-->高级-->选择“支持字符集”并点选“UTF-8”; 在回放脚本之前:Vuser-->运行时设置-->浏览器-->浏览器仿真-->更改-->使用浏览器-->语言下来选择 “中文(中国)”; 3、采用“首先,我们直接用正常的字去参数化,这里只举其中的一个例子来说明,比如<assuname>这个字段,我们用参数值“汽车”直接在脚本中替换“浣忔埧”,脚本回放失败。 然后就想到会不会是所有的中文字段都需要用才行呢?于是把所有的乱码都用简体字替换,脚本回放还是失败。 通过以上的两点试验,说明直接参数化的方法是行不通的,我们必须另找办法。 在LoadRunner中,为我们提供了一个字符串编码转换的函数lr_convert_string_encoding,用法如下: int lr_convert_string_encoding ( const char *sourceString, const char *fromEncoding, const char *toEncoding,

Pytorch Logistic回归

本小妞迷上赌 提交于 2020-02-22 23:04:59
参考《深度学习入门之Pytorch》 Logistic回归实现二分类问题 数据下载链接: data(提取码:q8gd) 1. 首先读取 数据 data.txt #logistic回归 #读取data.txt import matplotlib.pyplot as plt with open('data.txt','r') as f: data_list = f.readlines() data_list = [i.split('\n')[0] for i in data_list] data_list = [i.split(',') for i in data_list] data = [(float(i[0]),float(i[1]),float(i[2])) for i in data_list] #q前两个数据表示X,Y坐标,最后一个数据表示类别 打开data.txt,前两个数据是横纵坐标,最后一个是类别0,1。这个数据有两个属性一个类别。 接着把数据按类别不同画出来。 x0 = list(filter(lambda x: x[-1]==0.,data)) #filter去除不符合条件的,保留符合条件的数据 x1 = list(filter(lambda x: x[-1]==1.,data))#数据按类别筛选 plot_x0_x = [i[0] for i in x0]

LR脚本示例之常用函数

时光总嘲笑我的痴心妄想 提交于 2020-02-13 20:02:31
1、变量和参数的设置 //将IP地址和端口放入到参数中 lr_save_string("127.0.0.1:1080","ip"); //退出脚本建议使用lr_exit lr_exit(LR_EXIT_VUSER,LR_PASS); //计算变量数组的元素个数 int arr_m1[100]; int len1=0 len1=sizeof(arr_m1)/sizeof(int); //返回字符串的长度 char *tempStr="test is a house"; int len=0; len=strlen(tempStr); //在globals.h文件定义 double think_time=3;//后面可使用该变量来设置思考时间 lr_think_time(think_time); //生成m-n之间的随机数 rand()%(n-1)+m lr_think_time(rand()%(n-1)+m); //添加请求的头的编码信息 web_add_header("Content-Type","application/x-www-form-urlencoded; charset=UTF-8");//提交键值对时的编码信息 web_add_header("Content-Type","application/json; charset=utf-8");//提交json时的编码信息