25k

全国爬虫岗位汇总

假如想象 提交于 2019-12-03 21:50:51
不定期更新,技术练习顺手采集数据。 爬虫岗位不多,希望大家不要以爬虫为主业,招聘待遇和实际有差距 爬虫交流群:177655321 闪银奇异 要求 经验 3-5 年 / 大专 待遇 15k-30k 地点 [ 北京 ] 闪银奇异 要求 经验 3-5 年 / 本科 待遇 15k-30k 地点 [ 北京 ] 数据堂 要求 经验 3-5 年 / 本科 待遇 15k-25k 地点 [ 北京 ] 5U 体育 要求 经验 1-3 年 / 大专 待遇 6k-12k 地点 [ 广州 ] 宁波甬城 要求 经验 1-3 年 / 学历不限 待遇 15k-20k 地点 [ 宁波 ] DataEye 要求 经验 3-5 年 / 本科 待遇 15k-25k 地点 [ 深圳 ] 作业盒子 要求 经验 1-3 年 / 本科 待遇 15k-20k 地点 [ 北京 ] 迪联科技 要求 经验 1-3 年 / 学历不限 待遇 9k-18k 地点 [ 杭州 ] 北京智能管家科技有限公司 要求 经验 1-3 年 / 本科 待遇 15k-30k 地点 [ 北京 ] DMCC 要求 经验不限 / 学历不限 待遇 3k-4k 地点 [ 北京 ] 信数金服 要求 经验 3-5 年 / 本科 待遇 10k-16k 地点 [ 上海 ] 思贤股份 要求 经验 1-3 年 / 本科 待遇 8k-15k 地点 [ 上海 ] 乔布简历 要求 经验

Loading large file (25k entries) into dict is slow in Python?

匿名 (未验证) 提交于 2019-12-03 08:48:34
可以将文章内容翻译成中文,广告屏蔽插件可能会导致该功能失效(如失效,请关闭广告屏蔽插件后再试): 问题: I have a file which has about 25000 lines, and it's a s19 format file. each line is like: S214 780010 00802000000010000000000A508CC78C 7A There are no spaces in the actual file, the first part 780010 is the address of this line, and I want it to be a dict's key value, and I want the data part 00802000000010000000000A508CC78C be the value of this key. I wrote my code like this: def __init__(self,filename): infile = file(filename,'r') self.all_lines = infile.readlines() self.dict_by_address = {} for i in range(0, self.get_line_number()): self

月薪25K的萌新程序员基于python爬取新浪微博的内容和评论!牛逼

匿名 (未验证) 提交于 2019-12-02 22:11:45
前言 爬取内容和策略 这里先从简单开始,先爬取某个大V的微博。举例:爬取微博名为"思想聚焦"(微博ID: 1742566624),微博内容都是心灵鸡汤,还是挺受用的~ 基于模拟登陆来保存cookie,抓取指定web内容。 未登录新浪微博的情况下,是可以通过网址查看一个用户的首页,但是不能进一步查看该用户的关注和粉丝等信息,如果点击关注和粉丝,就会重定向回到登录页面。因此通过selenium模拟登陆保存cookie,在请求抓取其他页面时在headers中加入cookie信息,就可以抓取了。 这里需要通过selenium webdriver启动浏览器Firefox,因此系统需要安装Firefox,另外需要下载驱动geckodrive,下载地址为: https://github.com/mozilla/geckodriver/releases/ import osimport timeimport picklefrom tqdm import *from selenium import webdriverfrom web_crawl.weibo_crawl.settings import config# 方便完全加载登录页面def count_time(): for i in tqdm(range(40)): time.sleep(0.5)driver = webdriver

程序员,你是选择25K的996,还是选择18K的八小时?

杀马特。学长 韩版系。学妹 提交于 2019-12-02 05:06:05
“996+ICU”瞬间火爆程序员所在的圈子。有个“胆大包天”的家伙在GitHub上发起一个联合抵制项目,号召被压榨的程序员们联合起来抵制互联网公司的996工作制(不过见效不大,该加班的公司还是在正常加班)! 很多互联网公司早八晚五,早九晚六,甚至一部分创业公司Google范儿,不打卡,弹性工作制,讲究效率至上,快乐至上!(国内这种公司还是不算多的) 那么,作为程序员,你是选择哪种工作方式呢?如果是相等的报酬,那么肯定是要选择更快乐的工作方式。 那么,如果996的公司给你25k,八小时工作日的公司给你18k,你会怎么选择? 或者说,你现在的工资是18k,早九晚六,那么你会跳槽到一个月薪25k,强制996的公司吗? 其实老板喜欢玩996的更多的是创业公司,一些情况是工作真的做不完,还有一些情况是老板为了心里满足,让自己的钱得到充分的价值体现。很多人都说,强制996必然导致效率低下,身心疲惫。 说实话,部分996制度只是为了加班而加班,对真正问题的解决帮助不大,对工作效率更是没有根本性提升。有的员工一周996机制做出的成绩,还不如朝九晚五员工的工作业绩,这很能说明问题! 选择哪种方式去上班,只需要思考:你想拥有什么,就去追求什么! 下边我们来比较一下两种上班的情况。 996上班和八小时分别带来了什么? 月薪25K,扣完五险一金到手大概17090,不过有5100的公积金。 月薪18k

为什么面试你要25K,HR只给你20K?

这一生的挚爱 提交于 2019-11-29 20:51:33
周末了,我们来聊个轻松的话题,关于涨薪,哈哈~ 前阵子,栈长给大家分享了《 为什么公司宁愿 25K 重新招人,也不给你加到 20K? 》,今天我们来聊一个差不多的话题: 为什么面试你要25K,HR只给你20K? 今天的这个标题只是个例子,至少栈长我曾经是遇到过这种情况,我曾经面试要 25K,对方公司确只能给我 23K,有的只给 20K,最后妥协或者不了了之。。 为什么面试时,你提出的薪资要求,公司总要砍你价,总是不能达到你的预期?所以,我觉得有必要了解这些道道,知己知彼,才能百战百胜。 1、成本 就像我们出去买东西一样,能还价的我们都会习惯性的去还价,谁都想将自己的成本控制到最低,谁都不是傻子。 更何况是资本家,HR(人力资源)角色就是要帮企业控制人力成本,用最少的钱招到最合适的人。 所以被压价是正常现象,如果 HR 不压价,反而有问题,就要反思是不是自己薪资要的太低了。 2、制度 每个公司都有每个公司的薪酬制度,不同的岗位都有其对应的薪资范围。 第一,如果你应聘的岗位,你要的价钱超过了应聘公司的薪资范围,公司也很难满足你的期望; 第二,如果你岗位上不去,薪资也很难上得去。比如一个普通开发岗位,你再怎么跳槽,我想你工资早晚会到天花板。 3、稳定性 如果你期望的薪资超过了现有人员的大致水平,从公司整体人员稳定性来考虑也是非常不利的,自然也很难满足你的期望的