解码器

DSview的SPI解码实例解析

a 夏天 提交于 2020-01-13 18:05:39
DSview的SPI解码实例解析 编译流程 问:如果我们改好一个文件怎么编译? 法一: 编译安装咱们改好的文件 cd libsigrokdecode4DSL sudo make install 编译dsview cd .. cd DSView cmake . 运行,建议在命令行输入 DSview 运行,这样可以看到print等相关打印内容,方便查找错误。 法二: 在 /usr/local/share/libsigrokdecode4DSL/decoders/ 目录下,增删改文件后,直接打开DSview即可。 程序解析 _ init _.py 此文件的代码只有一句, from .pd import Decoder 但是解码器首先调用的 __init__.py ,所以通过他引入 pd.py . pd.py 首先需要import解码器相关的方法。 import sigrokdecode as srd from collections import namedtuple 关于类函数Decoder重要成员变量及函数介绍 1.父类需定义的变量 以下是父类需要一开始定义的变量,其中很多包含在前端UI界面显示所需的选项及注释。(以下代码中包含各项重要内容的解释说明) class Decoder ( srd . Decoder ) : api_version = 2 # api版本

ffmpeg编解码的流程和主要使用的api有哪些

旧巷老猫 提交于 2020-01-10 09:41:47
常用的结构体 AVCodec:编解码结构体 AVCodecContext:编解码上下文 AVFrame:解码后的帧 结构体的常用api av_frame_alloc():生成AVFrame结构体的 av_frame_free():释放AVFrame结构体 avcodec_alloc_context3():生成编解码器上下文 avcodec_free_context:释放解码器上下文 解码的步骤 查找解码器:avcodec_find_decoder 打开解码器:avcodec_open2 解码:avcodec_decode_video2 H264的编码流程 查找解码器:avcodec_find_encoder_by_name 设置编码参数,并打开编码器:avcodec_open2 编码:avcodec_encode_video2 来源: https://www.cnblogs.com/fandx/p/12174411.html

FFMPEG音视频解码

ぃ、小莉子 提交于 2020-01-04 15:58:32
文章转自: https://www.cnblogs.com/CoderTian/p/6791638.html 1.播放多媒体文件步骤 通常情况下,我们下载的视频文件如MP4,MKV、FLV等都属于封装格式,就是把音视频数据按照相应的规范,打包成一个文本文件。我们可以使用MediaInfo这个工具查看媒体文件的相关信息。 所以当我们播放一个媒体文件时,通常需要经过以下几个步骤 ①解封装(Demuxing):就是将输入的封装格式的数据,分离成为音频流压缩编码数据和视频流压缩编码数据。封装格式种类很多,例如MP4,MKV,RMVB,TS,FLV,AVI等等,它的作用就是将已经压缩编码的视频数据和音频数据按照一定的格式放到一起。例如,FLV格式的数据,经过解封装操作后,输出H.264编码的视频码流和AAC编码的音频码流。 ②解码(Decode):就是将视频/音频压缩编码数据,解码成为非压缩的视频/音频原始数据。音频的压缩编码标准包含AAC,MP3等,视频的压缩编码标准则包含H.264,MPEG2等。解码是整个系统中最重要也是最复杂的一个环节。通过解码,压缩编码的视频数据输出成为非压缩的颜色数据,例如YUV、RGB等等;压缩编码的音频数据输出成为非压缩的音频抽样数据,例如PCM数据。 ③音视频同步:就是根据解封装模块处理过程中获取到的参数信息,同步解码出来的音频和视频数据

图像分割网络探究

回眸只為那壹抹淺笑 提交于 2019-12-28 04:46:29
文章目录 1. FCN全卷积网络-2014 2. 编解码结构SegNet-2015 3. U-Net分割网络-2015 4. DeepLab v1,v2,v3 -2015,2017,2018 5. 实时分割网络ENet-2016 6. CRFasRNN-空了看看 7. PSPNet-2017 8.Parsenet 9. UNet++ 2018 10. Deepmask 实例分割 2015 11. RefineNet 多分辨率特征融合 -2016 12. LinkNet: Exploiting Encoder Representations for Efficient Semantic Segmentation 主要图像分割任务的区别: 语义分割:把一定数目不同的类别的图像分割出来,不需要分开多个相同的个体; 实例分割:区分一定数目相同类别的不同个体; 全景分割:区分未知数目相同类别的不同个体。 1. FCN全卷积网络-2014 参考: FCN 特点 : 输入:整幅图像。输出:空间尺寸与输入图像相同,通道数等于全部类别个数。真值:通道数为1(或2)的分割图像。 池化层P5上采样(反卷积)+P4上采样+P3上采样作为最终的预测具有最好的效果。即把后阶段的特征加到前面的特征图,再更大的尺寸进行预测。(一般分类是下采样到最好层进行加操作,但是这里是上采样

NLP系列(7)_Transformer详解

这一生的挚爱 提交于 2019-12-27 16:31:12
Ref https://jalammar.github.io/illustrated-transformer/ , https://blog.csdn.net/han_xiaoyang/article/details/86560459 编者按:前一段时间谷歌推出的BERT模型在11项NLP任务中夺得SOTA结果,引爆了整个NLP界。而BERT取得成功的一个关键因素是Transformer的强大作用。谷歌的Transformer模型最早是用于机器翻译任务,当时达到了SOTA效果。Transformer改进了RNN最被人诟病的训练慢的缺点,利用self-attention机制实现快速并行。并且Transformer可以增加到非常深的深度,充分发掘DNN模型的特性,提升模型准确率。在本文中,我们将研究Transformer模型,把它掰开揉碎,理解它的工作原理。 正文: Transformer由论文《Attention is All You Need》提出,现在是谷歌云TPU推荐的参考模型。论文相关的Tensorflow的代码可以从GitHub获取,其作为Tensor2Tensor包的一部分。哈佛的NLP团队也实现了一个基于PyTorch的版本,并注释该论文。 在本文中,我们将试图把模型简化一点,并逐一介绍里面的核心概念,希望让普通读者也能轻易理解。 Attention is All

Hamming code-汉明码(中文)

谁都会走 提交于 2019-12-25 22:19:12
汉明码 维基百科,自由的百科全书 本文提供 了参考文献列表 ,但 其来源尚不清楚, 因为它 没有足够的 内联引文 。 请 通过 引入 更精确的引用 来帮助 改进 本文 。 ( 2013年3月 ) ( 了解如何以及何时删除此模板消息 ) 二进制汉明码 海明(7,4)代码( r = 3 ) 而得名 理查德·汉明 分类 类型 线性块代码 块长 2 - [R - 1 ,其中 [R ≥2 讯息长度 2 r − r − 1 率 1 − r / (2 r − 1) 距离 3 字母大小 2 符号 [2 r − 1,2 r − r − 1,3] 2 代码 性质 完美的代码 v Ť Ë 在 电信中 , 汉明码 是一类 线性纠错码 。 汉明码最多可以检测两位错误或纠正一位错误,而无需检测未纠正的错误。 相反,简单的 奇偶校验码 不能纠正错误,并且只能检测到奇数个错误位。 汉明码是 完美的代码 ,也就是说, 汉明码 的 块长 和 最小距离 为三 ,可以实现最高 的编码 率 。 [1] 理查德·汉 明( Richard W. Hamming) 于1950年发明了汉明代码,作为一种自动纠正 打孔卡 引入的错误的方法 读者。 Hamming在他的原始论文中阐述了他的总体思想,但特别关注了 Hamming(7,4) 代码,该代码将三个奇偶校验位添加到四个数据位。 [2] 用 数学 术语来说

Pretraining-Based Natural Language Generation for Text Summarization

对着背影说爱祢 提交于 2019-12-22 07:17:31
摘要 提出了基于预训练的编码解码框架, 对于encoder: 使用Bert对输入序列进行特征表示 对于decoder,是主要分为两阶的 第一阶段 使用基于transfomer的解码器生成一个草稿的输出 在第二阶段,我们对该draft序列的每个字进行掩码,并将其馈送到Bert,然后通过组合由Bert生成的输入序列和草图表示,我们使用基于变压器的Decodd ER,用于预测每个屏蔽位置的精炼字。 Model 在BERT之上建立的序列到序列框架的基础上,我们首先设计了一个字级的改进解码器,以解决上述两个问题。我们还引入了一个离散的 目标函数为改进解码器以减少曝光偏置问题。我们的模型的总体结构如图1所示。 3.1 problem formulation 我们定义输入的文档为 摘要定义为 给定输入文档X,我们首先通过左上下文解码器来预测摘要草稿,然后使用生成的摘要草稿,我们可以在上下文侧进行条件并细化内容。 摘要。草案将指导和约束摘要的完善过程。 3.2 summary 摘要draft是基于seq-seq模型的,在编码器的端将比文档X 编码成表达向量,H,然后将其喂到解码器生成摘要draft. A ENcoder 来源: CSDN 作者: 昕晴 链接: https://blog.csdn.net/qq_40210472/article/details/103599944

《Effective Modeling of Encoder-Decoder Architecturefor Joint Entity and Relation Extraction》

会有一股神秘感。 提交于 2019-12-21 18:06:22
Abstract 关系元组由两个实体以及它们之间的关系组成,并且经常在非结构化文本中找到这样的元组。文本中可能存在多个关系元组,并且它们之间可能共享一个或两个实体。从句子中提取这样的关系元组是一项艰巨的任务,并且在元组之间 共享实体 或 重叠实体 会使其更具挑战性。本文中提出了两种使用 编码器-解码器体系结构 共同提取实体和关系的方法。 提出了一种用于关系元组的表示方案,该方案使解码器能够像机器翻译模型一样一次生成一个单词,并且仍然可以找到句子中存在的所有元组,它们具有不同长度的完整实体名称并且具有重叠的实体。提出一种基于指针网络的解码方法,其中在每个时间步生成一个完整的元组。 Introduction 传统使用流水线方法,使用命名实体识别来识别句子中的实体,然后使用分类器查找它们之间的关系(或没有关系)。但是由于实体检测和关系分类的完全分离,这些模型错过了句子中存在的多个关系元组之间的交互作用。 本文三个主要挑战:(i)该模型能够将实体和关系提取在一起。 (ii)能够提取具有重叠实体的多个元组。 (iii)能够准确地提取一个具有全名的元组实体。为了解决这些挑战,提出了两种使用编码器-解码器体系结构的新颖方法。首先提出一种用于关系元组的新表示方案(表1),以便它可以用简单的方式表示具有重叠实体和不同长度实体的多个元组。采用编码器-解码器模型

ffmpeg示例一:how to use libavformat and libavcodec to read video from a file.

那年仲夏 提交于 2019-12-21 13:17:14
to write the first five frames from "myvideofile.mpg" to disk in PPM format. 首先简单介绍以下视频文件的相关知识。我们平时看到的视频文件有许多格式,比如 avi, mkv, rmvb, mov, mp4等等,这些被称为 容器 ( Container ), 不同的容器格式 规定 了其中音视频数据的组织方式(也包括其他数据,比如字幕等)。容器中一般会封装有视频和音频轨,也称为视频流( stream )和音频 流,播放视频文件的第一步就是根据视频文件的格式, 解析 (demux)出其中封装的视频流、音频流以及字幕(如果有的话),解析的数据 读到包 (packet)中,每个包里 保存的是 视频帧(frame)或音频帧, 然后 分别对视频帧和音频帧调用相应的解码器(decoder)进行 解码 ,比如使用 H.264编码的视频和MP3编码的音频,会相应的调用H.264解码器和MP3解码器,解码之后 得到 的就是原始的图像( YUV or RGB) 和声音( PCM ) 数据,然后根据同步好的时间将图像显示到屏幕上,将声音输出到声卡,最终就是我们看到的视频。 FFmpeg 的API就是根据这个过程设计的,因此使用FFmpeg来处理视频文件的方法非常直观简单。下面就一步一步 介绍从视频文件中解码出图片的过程 。 声明变量