Temporal

H265码流分析

两盒软妹~` 提交于 2021-02-19 11:46:53
H265相比较于H264,除了包含SPS、PPS外,还多包含一个VPS;在NALU header上,H.264的HALU header是一个字节,而H.265则是两个字节。 以OX4001为例,头信息可以被解析成4个部分,其中: forbidden_zero_bit = 0:占1个bit,与H.264相同,禁止位,用以检查传输过程中是否发生错误,0表示正常,1表示违反语法; nal_unit_type = 32:占6个bit,用来用以指定NALU类型 nuh_reserved_zero_6bits = 0:占6位,预留位,要求为0,用于未来扩展或3D视频编码 nuh_temporal_id_plus1 = 1:占3个bit,表示NAL所在的时间层ID 对比H.264的头信息,H.265移除了nal_ref_idc,此信息被合并到了nal_unit_type中,H.265NALU类型规定如下: nal_unit_type NALU类型 备注 0 NAL_UNIT_CODE_SLICE_TRAIL_N 非关键帧 1 NAL_UNIT_CODED_SLICE_TRAIL_R 2 NAL_UNIT_CODED_SLICE_TSA_N 3 NAL_UINT_CODED_SLICE_TSA_R 4 NAL_UINT_CODED_SLICE_STSA_N 5 NAL_UINT_CODED

IJCAI2020 图相关论文集

◇◆丶佛笑我妖孽 提交于 2021-02-17 07:57:31
↑公众号关注 “Graph-AI” 专注于 图机器学习 IJCAI2020 图相关论文集 “ IJCAI(International Joint Conference on Artificial Intelligence,国际人工智能联合会议),是人工智能领域中最主要的学术会议之一,是CCF A类会议。 “ 本文将该会议与图相关的文章进行了整理,IJCAI接受的论文分为主赛道和特别赛道,都进行了大致的分类:计算机视觉、数据挖掘等。但因为本文是关注图方面的,所以按照图的种类来进行筛选。 “ 全部收录论文地址:http://static.ijcai.org/2020-accepted_papers.html Main track 图卷积网络 MR-GCN: Multi-Relational Graph Convolutional Networks based on Generalized Tensor Product LSGCN: Long Short-Term Traffic Prediction with Graph Convolutional Networks Multi-Class Imbalanced Graph Convolutional Network Learning Multi-View Attribute Graph Convolution Networks for

Utterance-level Aggregation for Speaker Recognition in The Wild

空扰寡人 提交于 2021-02-14 16:39:53
文章[1]主要针对的是语句长度不定,含有不相关信号的说话人识别。 深度网络设计的关键在于主干(帧级)网络的类型【the type of trunk (frame level) network】和有时间序列属性的聚合方法【the method of temporal aggregation】。 文中提出了一个强大的说话人识别深度网络,使用了一个“thin-ResNet” 网络结构,以及一个基于字典的NetVLAD[2]或者GhostVLAD层去在实践层面上聚合特征,这个可端到端训练。 文中实验在VoxCeleb1测试集上进行,证明该方法只需要更少的参数,并且SR(speaker recognition)性能优越。同时,调研了语句长度对网络性能的影响,得到结论:对于in the wild数据,a longer length is beneficial. 算法 对于SR,理想的模型应该有以下特性:1)处理任意长度的输入,得到一个定长的utterance-level descriptor;2)输出的descriptor应该是compat的,即低维表述,所需资源少,便于有效存储和恢复;3)输出descriptor应该是discriminative,例如不同说话人的descriptor之间的距离应该比同一说话人的大。 为了满足上述条件,本文采用 modified

论文速览|有论文开始关注你的取消关注行为了(清华AAAI20)

做~自己de王妃 提交于 2021-02-11 13:38:28
Title: Mining Unfollow Behavior in Large-Scale Online Social Networks via Spatial-Temporal Interaction Paper: https://www.aaai.org/ojs/index.php/AAAI/article/view/5358 GitHub: https://github.com/wuhaozhe/Unfollow-Prediction 来源: AAAI 20 机构: 清华大学 在线社交网络(OSN)通过两种普遍的行为来发展:关注和取消关注,分别表示建立关系和解除关系。社会网络演化研究主要着重于关注行为,而取消关注行为在很大程度上被忽略了。挖掘取消关注行为具有挑战性,因为用户对取消关注行为的决定不仅受到用户属性(例如信息和互惠)的简单组合的影响,但也受他们之间复杂的交互作用的影响。同时,先前的数据集很少包含足够的记录来推断这种复杂的相互作用。为了解决这些问题,我们首先构建一个大规模的真实世界的微博数据集,记录了180万中国用户的详细帖子内容和关系动态。 接下来,我们将用户的属性定义为两类:空间属性(例如,用户的社会角色)和时间属性(例如,用户的帖子内容)。利用构建的数据集,我们系统地研究了用户的空间和时间属性之间的交互作用如何导致取消关注行为。之后,我们提出了UMHI

计算机组成与设计(十二)—— 存储层次结构(二)

江枫思渺然 提交于 2021-01-24 03:36:04
高速缓存的原理 cpu和内存的速度差距越来越大,计算机的性能受到影响,而高速缓存的出现挽救了这一局面。 为什么在cpu和主存直接添加一个容量很小、速度更快的高速缓存能增加计算机的性能呢? 程序的局部性原理 这是一个经验性结论:计算机程序从时间和空间都表现出局部性。 时间局部性 ( Temporal Locality ):最近被访问的存储单元(指令或数据)很快会被访问 例如: for ( int i = 0 ;i < 100 ;i++ ) for ( int j = 0 ;j < 100 ;j++ ) sum += a[i][j]; 其中的sum、判断指令、加法指令、递增指令都会马上被访问 空间局部性 ( Spatial Locality ):正在被访问的存储单元附近单元很快会被访问 例如,a[i][j]的附近的元素很快会被访问 Cache对局部性的利用 Cache对空间局部性的利用 从主存中取出待访问的数据时,会同时取回相邻位置的主存单元的数据 以数据块为单位与主存进行数据交换 Cache对时间局部性的利用 保存最近被频繁访问的数据元素 Cache的访问过程 具体是如何实现的呢?示例过程: 1、由于是16个字节对齐,所以从2010H开始读取数据。每个块16个字节,所以最低位刚好表示在块中的索引,倒数第二位表示块的索引。所以第一次是分配表项1,为命中,将标签设为20H,有效位改为1

中文词性标注解释及句法分析标注解释

独自空忆成欢 提交于 2021-01-09 12:17:47
中文词性标注 [1] AD 副词 Adverbs [2] AS 语态词 --- 了 [3] BA 把 [4] CC 并列连接词(coordinating conj) [5] CD 许多(many),若干(several),个把(a,few) [6] CS 从属连接词(subording conj) [7] DEC 从句“的” [8] DEG 修饰“的” [9] DER 得 in V-de-const, and V-de R [10] DEV 地 before VP [11] DT 限定词 各(each),全(all),某(certain/some),这(this) [12] ETC for words 等,等等 [13] FW 外来词 foreign words [14] IJ 感叹词 interjecton [15] JJ 名词修饰语 [16] LB 被,给 in long bei-const [17] LC 方位词 [18] M 量词 [19] MSP 其他小品词(other particle) 所 [20] NN 口头名词、others [21] NR 专有名词 [22] NT 时间名词 (temporal noun) [23] OD 序数(ordinal numbers) [24] ON 拟声法(onomatopoeia) [25] P 介词 (对,由于,因为)(除了 “把

Video Architecture Search

核能气质少年 提交于 2020-12-19 14:54:19
Video Architecture Search 2019-10-20 06:48:26 This blog is from: https://ai.googleblog.com/2019/10/video-architecture-search.html Posted by Michael S. Ryoo, Research Scientist and AJ Piergiovanni, Student Researcher, Robotics at Google Video understanding is a challenging problem. Because a video contains spatio-temporal data, its feature representation is required to abstract both appearance and motion information. This is not only essential for automated understanding of the semantic content of videos, such as web-video classification or sport activity recognition, but is also crucial for

CTR点击率预估论文集锦

不羁的心 提交于 2020-12-17 06:47:53
前言 CTR预估对于搜索、推荐和广告都是非常重要的一个场景,近年来CTR预估技术更新迭代,层出不穷。这篇文章将记录CTR预估著名模型的相关论文。以下按照年份整理。 1.2020年 ( DFN ). Ruobing Xie. Deep Feedback Network for Recommendation ,2020,IJCAI(CCF-A). 出自腾讯微信团队. ( DMR ). Zequn Lyu. Deep Match to Rank Model for Personalized Click-Through Rate Prediction , AAAI (CCF-A), 出自阿里团队。 ( DTS ). Shu-Ting Shi. Deep Time-Stream Framework for Click-through Rate Prediction by Tracking Interest Evolution , AAAI (CCF-A), 出自南京大学和阿里合作。 ( UBR4CTR ). Jiarui Qin. User Behavior Retrieval for Click-Through Rate Prediction , SIGIR (CCF-A), 出自上海交通大学。 ( InterHAt ). Zeyu Li. Interpretable Click

多模态机器学习,在线教育退课预测新进展!

别说谁变了你拦得住时间么 提交于 2020-12-06 03:09:05
点击上方 “ 小白学视觉 ”,选择加" 星标 "或“ 置顶 ” 重磅干货,第一时间送达 在线教育场景下的学生退课行为预测,一直是机器学习(ML)与教育(EDU)交叉领域内较为火热的研究课题。 近年间,针对该方向的研究对象大多集中为大规模开放性在线课程(Massive Open Online Course, MOOC)的学生,通过收集 MOOC 平台上学生近期平台登录记录与相关网页埋点反馈数据,研究人员制作相关特征向量并结合机器学习模型算法,如Simple Logistic Regression、Gradient BoostingDecision Tree、Iterative Logistic Regression 等,对存在退课高风险的学生进行预测。 不同于针对MOOC平台学生的预测,当前研究领域对 K12 在线教育平台的学生退课预测还处于初期探索阶段。除此之外,在线 K12 教育平台的数据类型与 MOOC 平台数据相比存在更多模态,例如 K12 教育平台的学生在课前课后与平台顾问直接会产生沟通记录、课程进行过程中也会有相应的音视频记录等。因此,先前关于 MOOC平台的退课预测研究的方法与结论很难直接用于 K12 在线教育场景。 针对这些问题与特点,在2019年初,我们使用某K12在线教育1对1平台2018年秋冬季学期的学生历史行为数据

WWW2020 图相关论文集

与世无争的帅哥 提交于 2020-12-02 05:52:55
↑公众号关注 “Graph-AI” 专注于 图机器学习 WWW2020 图相关论文集 “ WWW(International World Wide Web Conferences,国际万维网大会),由国际万维网会议指导委员会主办,是CCF A类会议。 “ 全部收录论文列表:https://dblp.uni-trier.de/db/conf/www/www2020.html 01 Full Paper 图卷积 Unsupervised Domain Adaptive Graph Convolutional Networks A Generic Edge-Empowered Graph Convolutional Network via Node-Edge Mutual Enhancement 异构图 Task-Oriented Genetic Activation for Large-Scale Complex Heterogeneous Graph Embedding MAGNN: Metapath Aggregated Graph Neural Network for Heterogeneous Graph Embedding 图注意力模型 Towards Fine-grained Flow Forecasting: A Graph Attention Approach for