推荐算法

图解抖音推荐算法

有些话、适合烂在心里 提交于 2019-12-12 23:34:31
抖音推荐算法究竟如何是做抖音短视频运营的同学非常关心的问题,抖音官方并没有披露正式的算法,但凭借着民间的智慧和官方披露的部分信息中,网友已经总结出抖音推荐算法的秘密。这里整理资料如下: 首先看短视频发布后抖音一般会进行的一系列推荐流程 双重审核 在抖音,每天有数量庞大的新作品上传,纯靠机器审核容易被钻空子,纯靠人工审核又不太现实。因此,双重审核成为抖音算法筛选视频内容的第一道门槛。 机器审核:一般是通过提前设置好的人工智能模型来识别你的视频画面和关键词,它主要有两个关键作用:其一,审核作品、文案中是否存在违规行为,如果疑似存在,就会被机器拦截,通过飘黄、标红等提示人工注意;其二,通过抽取视频中的画面、关键帧,与抖音大数据库中已存在的海量作品进行匹配消重,内容重复的作品进行低流量推荐,或者降权推荐(仅粉丝可见、仅自己可见)。 人工审核:主要集中在3块:视频标题、封面截图和视频关键帧。针对机器审核筛选出疑似违规作品,以及容易出现违规领域的作品,抖音审核人员进行逐个细致审核。如果确定违规,将根据违规账号进行删除视频、降权通告、封禁账号等处罚。 第一步:冷启动 抖音的推荐算法机制是著名的信息流漏斗算法,也是今日头条的核心算法。通过审核后,第一步叫冷启动流量池曝光,比如你今天上传一个视频,通过双重审核的作品,系统将会分配给你一个初始流量池:200-300在线用户(也可能有上千个曝光)

协同过滤算法

ε祈祈猫儿з 提交于 2019-12-11 23:19:20
推荐算法具有非常多的应用场景和商业价值,因此对推荐算法值得好好研究。推荐算法种类很多,但是目前应用最广泛的应该是协同过滤类别的推荐算法,本文就对协同过滤类别的推荐算法做一个概括总结,后续也会对一些典型的协同过滤推荐算法做原理总结。 1. 推荐算法概述 推荐算法是非常古老的,在机器学习还没有兴起的时候就有需求和应用了。概括来说,可以分为以下5种: 基于内容的推荐 这一类一般依赖于自然语言处理NLP的一些知识,通过挖掘文本的TF-IDF特征向量,来得到用户的偏好,进而做推荐。这类推荐算法可以找到用户独特的小众喜好,而且还有较好的解释性。这一类由于需要NLP的基础,本文就不多讲,在后面专门讲NLP的时候再讨论。 协调过滤推荐 本文后面要专门讲的内容。协调过滤是推荐算法中目前最主流的种类,花样繁多,在工业界已经有了很多广泛的应用。它的优点是不需要太多特定领域的知识,可以通过基于统计的机器学习算法来得到较好的推荐效果。最大的优点是工程上容易实现,可以方便应用到产品中。目前绝大多数实际应用的推荐算法都是协同过滤推荐算法。 混合推荐 这个类似我们机器学习中的集成学习,博才众长,通过多个推荐算法的结合,得到一个更好的推荐算法,起到三个臭皮匠顶一个诸葛亮的作用。比如通过建立多个推荐算法的模型,最后用投票法决定最终的推荐结果。混合推荐理论上不会比单一任何一种推荐算法差,但是使用混合推荐

Multi-Task Feature Learning for Knowledge Graph Enhanced Recommendation(知识图谱)

╄→尐↘猪︶ㄣ 提交于 2019-12-10 21:35:31
知识图谱(Knowledge Graph,KG)可以理解成一个知识库,用来存储实体与实体之间的关系。知识图谱可以为机器学习算法提供更多的信息,帮助模型更好地完成任务。 在推荐算法中融入电影的知识图谱,能够将没有任何历史数据的新电影精准地推荐给目标用户。 实例描述 现有一个电影评分数据集和一个电影相关的知识图谱。电影评分数据集里包含用户、电影及评分;电影相关的知识图谱中包含电影的类型、导演等属性。 要求:从知识图谱中找出电影间的潜在特征,并借助该特征及电影评分数据集,实现基于电影的推荐系统。 本实例使用了一个多任务学习的端到端框架MKR。该框架能够将两个不同任务的低层特征抽取出来,并融合在一起实现联合训练,从而达到最优的结果。有关MKR的更多介绍可以参考以下链接: https://arxiv.org/pdf/1901.08907.pdf 一、准备数据集 在1901.08907.pdf的相关代码链接中有3个数据集:图书数据集、电影数据集和音乐数据集。本例使用电影数据集,具体链接如下: https://github.com/hwwang55/MKR/tree/master/data/movie 该数据集中一共有3个文件。 item_index2entity_id.txt:电影的ID与序号。具体内容如图1所示,第1列是电影ID,第2列是序号。 kg.txt:电影的知识图谱

推荐算法(2)——常用的预测算法

心不动则不痛 提交于 2019-12-07 21:52:20
推荐算法莫过于预测用户的想要的东西给予推荐。 常用的预测算法有:slope one算法,hmm算法, 1. slope one算法 slope one算法是一种简单的协同过滤算法。基本原理是通过平均值预测对某个事物的喜好程度,因为slope one算法认为平均值可以代替某2个未知个体之间的打分差异。如: 户 对事物A打分 对事物B打分 X 3 4 Y 2 4 Z 4 ? 那么用户z对事物B对打多少分呢?slope one算法通过计算平均值:((3-4) + (2-4)) /2 = -1.5,也就是人们对事物B的打分比事物A高1.5,于是猜测用户Z对事物B打分:4+.5=5.5。 待续。。。。。。 来源: CSDN 作者: 正弈 链接: https://blog.csdn.net/chenlianchang/article/details/8731222

不懂推荐算法也能设计推荐系统

时光总嘲笑我的痴心妄想 提交于 2019-12-07 09:28:01
本文以商业化应用推荐为例,告诉我们不懂推荐算法的产品,也能从产品侧出发, 设计出一款不错的推荐系统。 相信很多新手产品,看到算法二字,多是懵圈的。 什么排序算法、最短路径等都是相对传统的算法(注:传统是指科班出身的产品都会接触过)。但对于推荐算法,多数产品对着网上搜到的资源,都会无从下手。特别当某些推荐算法 和 “AI”扯上关系后,更是加大了理解的难度。 但,不了解推荐算法,就无法做推荐系统了吗?其实,产品人员可以从产品侧挖掘自己的长处。 下面,以商业化应用推荐为例,讨论如何在不熟悉推荐算法的前提下设计推荐系统。 01 解决什么问题 收入: 推荐用户感兴趣的应用,提高收入。 改善用户体验: 对于用户不感兴趣的应用,少推荐,减少整体的广告显示,提升用户体验(毕竟,多数情况下,商业化与体验是矛盾的)。 02 设定目标 这是比较难的。需要了解当前的推荐策略 与 优化后的策略,才能制定出来。要么你熟悉推荐算法,要么知晓行业数据。建议是:如果没有明确的依据,不要拍脑袋。 03 有什么数据 用户画像,是一个谈到烂的话题。但小体量的公司很难把用户画像落地,因为需求是简单的:根据用户画像,用户的喜欢做……但在实际执行中,很难建立一个数据模型处理万千的数据并应用到推荐场景当中。 下面讨论数据情况,有哪些维度的数据,直接决定数据模型。 1. 基础数据 无论贵公司是以APK还是SDK的方式

不懂推荐算法也能设计推荐系统

喜你入骨 提交于 2019-12-06 17:26:45
本文以商业化应用推荐为例,告诉我们不懂推荐算法的产品,也能从产品侧出发, 设计出一款不错的推荐系统。 相信很多新手产品,看到算法二字,多是懵圈的。 什么排序算法、最短路径等都是相对传统的算法(注:传统是指科班出身的产品都会接触过)。但对于推荐算法,多数产品对着网上搜到的资源,都会无从下手。特别当某些推荐算法 和 “AI”扯上关系后,更是加大了理解的难度。 但,不了解推荐算法,就无法做推荐系统了吗?其实,产品人员可以从产品侧挖掘自己的长处。 下面,以商业化应用推荐为例,讨论如何在不熟悉推荐算法的前提下设计推荐系统。 01 解决什么问题 收入: 推荐用户感兴趣的应用,提高收入。 改善用户体验: 对于用户不感兴趣的应用,少推荐,减少整体的广告显示,提升用户体验(毕竟,多数情况下,商业化与体验是矛盾的)。 02 设定目标 这是比较难的。需要了解当前的推荐策略 与 优化后的策略,才能制定出来。要么你熟悉推荐算法,要么知晓行业数据。建议是:如果没有明确的依据,不要拍脑袋。 03 有什么数据 用户画像,是一个谈到烂的话题。但小体量的公司很难把用户画像落地,因为需求是简单的:根据用户画像,用户的喜欢做……但在实际执行中,很难建立一个数据模型处理万千的数据并应用到推荐场景当中。 下面讨论数据情况,有哪些维度的数据,直接决定数据模型。 1. 基础数据 无论贵公司是以APK还是SDK的方式

《高考志愿填报App中的个性化推存方法研究与应用》论文笔记(十四)

浪子不回头ぞ 提交于 2019-12-06 03:21:01
一、基本信息 标题:高考志愿填报App中的个性化推存方法研究与应用 时间:2018 来源: 江西财经大学 关键词: 个性化推荐; 高考; App开发; 二、研究内容 1.主要内容 通过对国内高考 APP 个性化推荐功能进行分析,大部分 APP 都个性化推荐功能都含有不同程度的付费项,并且存在界面不友好,数据不准确等问题,论文提出一套基于高校投档线分数预测基础之上的推荐报告生成算法,并提出通过对推准率(推荐报告中排名前列的高校为考生能够上的高校的概率)和推全率(推荐报告中考生能够进入的高校总数与考生能够进入的所有高校总数的比例)的研究论证推荐算法。并在用户使用招生类 APP 模拟投档功能的基础之上提出个性化广告推荐算法,通过用户使用模拟投档功能产生的行为数据为用户建模,并通过模型推荐广告信息。 2. 论文结构 第一章:介绍论文课题的研究背景,阐述个性化推荐系统的发展状况,对论文的研究思路总体结构进行介绍。 第二章:分别对高考体制改革的趋势与现状进行介绍。就现含有的高考招生类App 的应用进行介绍和比较。并对个性化推荐功能的研究情况和应用进行介绍。 第三章:是对面向考生的个性化高校推荐算法进行详细的介绍和实验,包括对用户的需求分析和算法的设计。 第四章:是基于考生填报数据的个性化招生广告推荐算法的详细介绍和实验室,包括考生使用招生类 App

主流推荐算法

霸气de小男生 提交于 2019-12-06 01:42:50
主流推荐算法大致可分为: 基于内容(相似度)的推荐 基于用户(User)/物品(Item)相似度的协同过滤 热点新闻推荐(你看到的那些头条新闻) 基于模型的推荐(通过输入一些用户特征进入模型,产生推荐结果) 混合推荐(以上十八般兵器一起耍!) 信息源:用户画像、物品画像、群体数据、知识模型。 1、内容算法推荐之爆款 2、四种推荐算法摘录 融合四种信息源的混合推荐方法可以弥补各自算法的缺陷。 问题1、基于内容的推荐算法和基于项目相似度的协调过滤之区别 基于内容的推荐算法 对于个性化阅读来说,一个item就是一篇文章。根据上面的第一步,我们首先要从文章内容中抽取出代表它们的属性。常用的方法就是利用出现在一篇文章中词来代表这篇文章,而每个词对应的权重往往使用信息检索中的tf-idf来计算。比如对于本文来说,词“CB”、“推荐”和“喜好”的权重会比较大,而“烤肉”这个词的权重会比较低。利用这种方法,一篇抽象的文章就可以使用具体的一个向量来表示了。第二步就是根据用户过去喜欢什么文章来产生刻画此用户喜好的 profile了,最简单的方法可以把用户所有喜欢的文章对应的向量的平均值作为此用户的profile。比如某个用户经常关注与推荐系统有关的文章,那么他的profile中“CB”、“CF”和“推荐”对应的权重值就会较高。在获得了一个用户的profile后

推荐算法之用矩阵分解做协调过滤——LFM模型

故事扮演 提交于 2019-12-05 10:59:53
隐语义模型(Latent factor model,以下简称 LFM ),是推荐系统领域上广泛使用的算法。它 将矩阵分解应用于推荐算法推到了新的高度 ,在推荐算法历史上留下了光辉灿烂的一笔。本文将对 LFM 原理进行详细阐述,给出其基本算法原理。此外,还将介绍使得隐语义模型声名大噪的算法 FunkSVD 和在其基础上改进较为成功的 BiasSVD 。最后,对 LFM 进行一个较为全面的总结。 1. 矩阵分解应用于推荐算法要解决的问题 在推荐系统中,我们经常可能面临的场景是:现有大量用户和物品,以及少部分用户对少部分物品的评分,我们需要使用现有的用户对少部分物品的评分去推测用户对物品集中其他物品的可能的评分,从而将预测中评分高的物品推荐给用户。例如下面的用户物品评分表: 用户\物品 物品 1 物品 2 物品 3 物品 4 物品 5 用户 1 3 2 用户 2 1 2 6 用户 3 3 4 6 用户 4 1 2 5 用户 5 4 2 3 对于每个用户,我们希望较准确的预测出其对未评分物品的评分。将m个用户和n个物品的评分看做一个矩阵 M ,从而将矩阵分解应用到该场景,即可解决这一问题。而本文,将关注于矩阵分解用于到推荐的方法之一,即 LFM 算法的解决方案。 2. LFM LFM 算法的核心思想是通过隐含特征(Latent factor)联系用户和物品

如何从 0 到 1 构建个性化推荐?

痴心易碎 提交于 2019-12-04 14:34:51
文章作者:曾钦榜 58同城 高级技术经理 编辑整理:周晓侠 内容来源:58技术沙龙 出品社区:DataFun 注:欢迎转载,转载请在留言区内留言。 导读:随着科学技术的飞速发展,互联网被广泛应用于各个领域,而以互联网为基础的招聘模式也越来越受到企业的青睐。互联网招聘具有不受地域限制、覆盖面广、招聘成本低、针对性强、方便快捷、时效性强等优点,现已得到广泛应用,其中,58招聘是互联网招聘行业中规模最大的平台。今天主要跟大家分享下58招聘如何通过个性化推荐技术服务大规模求职者和招聘企业。分享题目是从零到一构建58招聘个性化推荐,主要通过以下三方面进行介绍: 招聘业务介绍 个性化推荐实践 心得分享与规划 ——招聘业务介绍—— 58招聘业务简介 2018年我国全国总人口13.9亿多,其中就业人口7.7亿,招聘基数庞大。三大产业就业人口占比分别26.11%,27.57%,46.32%,其中第三大产业占比最大,部分发达国家第三大产业占比已达到70%~80%,随着经济的发展,我国未来就业市场和就业分布将发生大的变化。2019年8月城镇调查显示我国失业率为5.2%,其中25~59岁失业率4.5%,同时每年有800多万的应届生加入就职市场。58招聘作为我国互联网招聘行业之首,每天服务于千万级求职者和大中小企业,平台每天生成千万级连接,促成大量求职者求职成功。 58招聘平台主要服务于求职者和招聘方