工程信息

结合工程实践选题调研分析同类软件产品

扶醉桌前 提交于 2019-11-30 22:08:26
我的工程实践选题是《关于物联网组网方案的搜索引擎》,属于定向搜索引擎的一种,所以我选择百度,谷歌,必应三种搜索引擎来作为比较。 这些软件的开发者是怎么说服你(陌⽣⼈)成为他们的⽤户的?他们的⽬标都是盈利么?他们的⽬标 都是赚取⽤户的现⾦么?还是别的? 搜索引擎是我们日常上网活动中不可缺少的一个工具,能有效提高我们收集信息解决问题的能力。作为如此功能强大的工具,无需宣传我们就会主动去使用;百度在中文网络中名声最大,使用者也最广泛;谷歌的查找效率与精度更好,更受专业人士的欢迎;必应是微软推出的一款与谷歌竞争的搜索引擎,性能上不如谷歌,但好于百度。 搜索引擎作为商业软件,目标自然是盈利。他们的盈利方式主要是通过向用户提供免费服务扩大市场,用广告营收来作为利润来源。 这些软件是如何到你⼿⾥的(邮购,下载,互相拷⻉、在线使用 ……) 搜索引擎是在线使用软件 这些软件有 Bug 么?⼜是如何更新新版本的? 百度用的较多,所以主要分析百度。百度很少让用户看见 bug ,一般来说有时候会出现不能访问的问题,但这不一定和 bug 有关,也有可能与硬件或网络状况有关 此类软件是什么时候开始出现的,同⼀类型的软件之间是如何竞争的? 发展趋势如何? 搜索引擎最早出现于 1990 年, Archie , 用于搜索 FTP 服务器上的文件 。 搜索引擎之间的竞争主要体现在对于用户的争夺,搜索引擎效果越好

1、特征工程

寵の児 提交于 2019-11-27 15:34:34
特征工程是机器学习中最耗时、最繁重的部分。非常重要。 数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。 特征工程的目的:将信息使用更加高效的编码方式(特征)表示,信息损失最小,原始数据中包含的规律仍然存在。这种新的编码方式要尽量减少原始数据中的不确定因素(噪声、异常数据、数据缺失等)。 其中特征处理是核心环节。 来源: https://www.cnblogs.com/pacino12134/p/11368584.html

特征工程系列:数据清洗

拜拜、爱过 提交于 2019-11-27 04:44:16
特征工程系列:数据清洗 本文为数据茶水间群友原创,经授权在本公众号发表。 关于作者:JunLiang,一个热爱挖掘的数据从业者,勤学好问、动手达人,期待与大家一起交流探讨机器学习相关内容~ 0x00 前言 数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。由此可见, 特征工程在机器学习中占有相当重要的地位 。在实际应用当中,可以说特征工程是机器学习成功的关键。 那特征工程是什么? 特征工程是利用数据领域的相关知识来创建能够使机器学习算法达到最佳性能的特征的过程。 特征工程又包含了Data PreProcessing(数据预处理)、Feature Extraction(特征提取)、Feature Selection(特征选择)和Feature construction(特征构造)等子问题,本章内容主要讨论数据预处理的方法及实现。 特征工程是机器学习中最重要的起始步骤,数据预处理是特征工程的最重要的起始步骤,而数据清洗是数据预处理的重要组成部分,会直接影响机器学习的效果。 0x01 数据清洗介绍 数据清洗(Data cleaning)– 对数据进行重新审查和校验的过程,目的在于删除重复信息、纠正存在的错误,并提供数据一致性。 数据清洗, 是整个数据分析过程中不可缺少的一个环节,其结果质量直接关系到模型效果和最终结论。 0x02 格式内容清洗 1.格式内容问题产生的原因

史上最强maven配置详情

纵然是瞬间 提交于 2019-11-26 14:14:12
史上最强maven配置详情 优点 对第三方依赖库进行了统一的版本管理 统一了构建过程 统一了项目的目录结构 构建 清理 : mvn clear 编译 : mvn compile 测试 : mvn test 打包 : mvn package 部署 : mvn deploy 安装(将jar安装到本地仓库): mvn install 约定优于配置 Maven 规定了项目的源代码,测试代码,资源文件,编译包输出文件,字节码文件等文件的目录,统一了项目的目录结构 源代码目录 : /src/main/java 资源文件目录 : /src/main/resources 测试代码目录 : /src/test/java 包输出目录 : /target 编译后的字节码输出目录 : /target/classes POM文件详解 POM 代表工程对象模型,它是使用Maven工作时的基本组件,是一个xml文件,它被放在工程根目录下,文件命名为pom.xml; POM 包含了关于工程和各种配置细节的信息,Maven使用这些信息构建工程; POM 也包含了目标和插件,当执行一个任务或者目标时,Maven会查找当前目录下的POM,从其中读取所需要的配置信息,然后执行目标; 在创建POM之前,我们首先确定工程组(groupId),及其名称(artifactId)和版本,在仓库中这些属性是工程的唯一标识;