图像处理

基于三维模型的目标识别和分割在杂乱的场景中的应用

大兔子大兔子 提交于 2021-01-13 07:19:12
点击上方“ 3D视觉工坊 ”,选择“星标” 干货第一时间送达 在杂波和遮挡情况下,对自由形式物体的识别及分割是一项具有挑战性的任务。本文提出了一种新的基于三维模型的算法,该算法可以有效地执行该任务,对象的三维模型是从其多个无序范围图像离线自动构建的,这些视图被转换为多维,用张量表示,通过使用基于哈希表的投票方案将视图的张量与其余视图的张量匹配,这些视图之间自动建立对应关系,形成一个相对转换图,用于将视图集成到无缝3D模型之前注册视图,该模型及其张量表示构成了模型库。在在线识别过程中,通过投票场景中的张量与库中的张量同时匹配,对于得票最多的模型张量并计算相似性度量,进而被转换为场景,如果它与场景中的对象精确对齐,则该对象被声明为识别和分割。这个过程被重复,直到场景完全分割。与自旋图像的比较表明,本文算法在识别率和效率方面都是优越的。 1.算法框图 (1) 离线三维建模 本文对多维视图对应算法使用4d散列表来执行一组对应搜索,如上图中的模块B和C,自动建立自由形式对象的无序2.5d视图之间的对应关系,结果是无序视图之间的相对转换的生成树,用于在基坐标系下粗略地对它们进行配准,使用多视图精细配准(模块D)对配准进行细化,然后将视图集成并重建为无缝三维模型(模块E)。 (2)在线识别与分割 场景的点云被转换成三角形网格,由于性能原因而被抽取。接下来,从这个网格中随机选择一对顶点来构造张量

【EI快速-高录用】IWAACE 2021诚邀各位学者踊跃投稿。

倾然丶 夕夏残阳落幕 提交于 2021-01-13 00:30:33
第五届先进算法与控制工程国际论坛 ( IWAACE 2021 ) 会议简介 2021年第五届先进算法与控制工程国际论坛(IWAACE 2021)将于2021年2月26-28日在中国珠海召开。 IWAACE 2021 将围绕“先进算法”、“控制工程”等研究领域,为所有学者、行业专家提供一个交流新想法和研究成果的有利平台。 本次会议也将助力参会者建立业务或研究上的联系以及寻找未来事业上的全球合作伙伴。我们希望这次会议能够对这些最新科学领域的知识更新做出重大贡献。诚挚欢迎海内外学者投稿和参会。 会议信息 会议简称: I WAACE 202 1 会议全称: 2021 5th International Workshop on Advanced Algorithms and Control Engineering 会议地点: 珠海 , 中国 研究领域: 先进算法 控制工程 官网地址: http://www.iwaace-hn.com/ 会议特色 1.EI 、Scopus双检索 ,检索时间稳定 在 会后 3- 6 个 月。 2.支持作者组建workshop形式投稿 论文检索 本次会议所录用的论文将在《Journal of Physics: Conference Series》(JPCS)(ISSN:1742-6588)上发表,并提交EI、Scopus等核心索引。 往届均已检索

车载双目摄像头,为什么特斯拉还在迟疑?

允我心安 提交于 2021-01-11 08:19:44
来源|智车科技 作者|刘洪 埃隆·马斯克一直在诟病激光雷达的成本,现在激光雷达便宜的竞争者来了,他应该点赞哦。不过,特斯拉至今没有搭载,咋的了? 埃隆·马斯克的特斯拉打死也不搭载激光雷达(LiDAR)自有其道理,但也没能找到让尚处于自动驾驶起步阶段的车辆发现未经机器学习训练的庞然大物的方法,以至于因“视而不见”而事故不断,当然,无端突然加速又是另外一回事了。 事实上,近年来马斯克爱用的摄像头方案已有了新的进展,引起了主机厂和Tier 1极大的关注和采用,它就是 立体视觉(StereoVision)技术,也有人叫它3D感测或双目摄像头, 当然还有多目摄像头。今天就来聊聊这个双目摄像头的一些事儿。 01 特斯拉黑客的发现 谈到一种技术,人们总要看电动汽车的领头羊特斯拉是怎么做的,双目摄像头自然也不能例外。 最近,特斯拉黑客@greentheonly在Autopilot代码中观察到Tesla Semi卡车的10个摄像头设置,发现了Semi可能会安装10个摄像头的提示。他说:“Semi的第十个摄像头被列为“右中继器(Repeater)2”,这是相当有趣的,在Class 8卡车位于中央驾驶位置。车辆控制器‘HW3.2’也提到了Semi的10个摄像头设置。所以只有一个右中继器是不够的。”不过,上述发现没有涉及双目立体视觉之类的摄像头。 此前,Model 3车主Erik J.

Halcon学习笔记之OCR系列-车牌识别

守給你的承諾、 提交于 2021-01-10 11:39:52
车牌识别的第一步就是先随便在路边上找一辆车,把他的车牌号拍下来留作图像处理的图片。 为了保护隐私,只露出后面部分。 ![在这里插入图片描述](https://img-blog.csdnimg.cn/20210107152909995.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80NDUwNjMwNQ==,size_16,color_FFFFFF,t_70) 下面便是图像处理的过程: read_image ( Image , 'C:/Users/Administrator/Desktop/dsBuffer.bmp.png' ) * 将彩色图片通过三通道分成三张图片,筛选对比效果最好的图片 * 当然在现实应用中能用灰度相机拍的话没有必要用彩色相机,一般用到彩色相机了都是需要检测颜色相关的内容 decompose3 ( Image , R , G , B ) * 或者直接转成灰度图也可以,对于彩色图片两种都试一下,主要看效果 rgb1_to_gray ( Image , GrayImage ) R通道的对应的图片: 直接转成灰度图片的效果: 显而易见,R通道的图像对比度更高

多模态深度学习:用深度学习的方式融合各种信息

倖福魔咒の 提交于 2021-01-10 08:54:47
点击上方 “ AI算法与图像处理 ”,选择加"星标"或“置顶” 重磅干货,第一时间送达 作者: Purvanshi Mehta 来源:AI公园 编译:ronghuaiyang 导读 使用深度学习融合各种来源的信息。 多模态数据 我们对世界的体验是多模态的 —— 我们看到物体,听到声音,感觉到质地,闻到气味,尝到味道。模态是指某件事发生或经历的方式,当一个研究问题包含多个模态时,它就具有多模态的特征。为了让人工智能在理解我们周围的世界方面取得进展,它需要能够同时解释这些多模态的信号。 例如,图像通常与标签和文本解释相关联,文本包含图像,以更清楚地表达文章的中心思想。不同的模态具有非常不同的统计特性。 多模态深度学习 虽然结合不同的模态或信息类型来提高效果从直观上看是一项很有吸引力的任务,但在实践中,如何结合不同的噪声水平和模态之间的冲突是一个挑战。此外,模型对预测结果有不同的定量影响。在实践中最常见的方法是将不同输入的高级嵌入连接起来,然后应用softmax。 多模态深度学习的例子,其中使用不同类型的神经网络提取特征 这种方法的问题是,它将给予所有子网络/模式同等的重要性,这在现实情况中是非常不可能的。 所有的模态对预测都有相同的贡献 对网络进行加权组合 我们采用子网络的加权组合,以便每个输入模态可以对输出预测有一个学习贡献(Theta)。 我们的优化问题变成-

java和python的比较

夙愿已清 提交于 2021-01-10 08:50:37
  1.   在实际运用的python入门简略,但要学会用python干活,需求再学习python各种库,pyhton的强壮在于库,为什么python的库强壮,原因是python的库能够用python,c言语,c++等规划,再提供给python运用,所以无论gpu运转,神经网络,智能算法,数据剖析,图像处理,科学核算,林林总总的库在等着你用。而java没有python那么多的开源库,很多库是商业公司内部运用,或发布出来只是一个jar包,看不到原始代码。python虚拟机由于编译性没有java的支撑的好(或者说成心这么规划的),一般直接运用源码(linux),或源码简略打个包(如pyexe)。   2.   python用处最多的是脚本,java用处最多的是web,pyhotn是胶水,能够把各类不相关的东西粘在一重用,java是基佬,能够经过软件工程组成几百个人的团队和你pk,商业化气息重。不过我以为仍是python强壮,由于能够便利调用c或c++的库,但软件工程和商业化运作没有java好,合适快捷开发。   3.   假如你想写程序卖软件用java,可用上ibm服务器,上oracle数据库,上EMC存储,价格高,商业采购公司喜欢这种高大上。假如你要直接用程序生成金钱用python,python能够实现宽客金融,数据回测,炒股,炒期权,炒黄金,炒比特币,对冲套利,统计套利

福利大放送!!!

烈酒焚心 提交于 2021-01-09 08:05:36
由于前一段时间小白没有更新,所以近期的几次更新小白决定陆续祭出小白珍藏多年的各种学习资料。 01 — 首先小白为大家带来的是《学习OpenCV(中文版)》的电子书,改书可以说是小白的入门书籍啦,小白在几年前学习图像处理的时候就是参考的该书。虽然过去了很多年,不过相信对于初学者还是可以学到很多的图像相关理论知识的。 链接:https://pan.baidu.com/s/17tclbzLpJeHc2wLuT4QbnQ 密码:upiy 02 — 接下来小白为大家带来也是一本很经典的电子书《数字图像处理(冈萨雷斯)》,这本书小白当面也是认真的拜读了一边,从中不仅学到了图像处理的操作,也学会了很多Matlab相关的操作 链接:https://pan.baidu.com/s/15_6lPe1S7OnfuVtzjbUNhg 密码:1wdo 03 — 最后小白给大家推荐是高清版的《OpenCV3 编程入门》,学习该书需要有一定的C++的基础,不过拥有C语言编程基础的小伙伴也可以很容易看懂书中内容的。 链接:https://pan.baidu.com/s/1VkWa01CBU306M6TZHxS0Aw 密码:6qd4 小白不想通过关注公众号之后留言来获取链接的方式,所以 小白直接给出了三本电子书的链接,小伙伴可以直接通过链接下载。但是希望拒的上面这些书籍有用的小伙伴帮忙转发一下朋友圈

黑科技!漫画文字自动翻译

廉价感情. 提交于 2021-01-08 18:25:05
点击上方 “ AI算法与图像处理 ”,选择加" 星标 "或“ 置顶 ” 重磅干货,第一时间送达 【CSDN 编者按】相信不少漫画迷都曾为了追漫画特地去学习外语,学外语的时候很累,看漫画的时候很爽。现在,东京大学两位博士研发了漫画文字自动翻译的一个工具,追漫再也不累了! 作者 | 神经星星 责编 | 张文 出品 | CSDN(ID:CSDNnews) 内容概要:一项关于漫画文字自动翻译的研究,引发了热议,由两位东京大学博士组成的 Mantra 团队发布了一篇论文,目前已被 AAAI 2021 收录,该 Mantra 项目旨在为日本漫画提供 自动化的机器翻译工具。 最近,由东京大学 Mantra 团队、雅虎(日本)等机构联合发布的《Towards Fully Automated Manga Translation 实现漫画全自动翻译》论文,引发了学界和二次元界的关注。 如图所示:左一为日文原版, 自动化输出英文版(右二)和中文版(右一) Mantra 团队成功地实现了将漫画的中的对话、气氛词、标签等文字自动识别,并做到了区分角色、联系上下文,最后将翻译文字准确替换、嵌入气泡区域 。 有了这个翻译神器,估计翻译组、追漫的小伙伴们都该偷着乐了。 发论文、公开数据集、商业化一条龙 在科研方面,目前该篇论文已经被 AAAI 2021 接收,研究团队还开源了一个包含五部不同风格(幻想、爱情、战斗

C66x DSP如何实现程序远程升级

自闭症网瘾萝莉.ら 提交于 2021-01-07 19:25:09
前 言 DSP板卡一般通过仿真器进行调试,包括程序的加载与固化。由于众多应用场合对产品体积、产品密封性均有严格要求,或我们根本无法近距离接触产品,因此终端产品很多时候无法预留JTAG接口或通过JTAG接口升级程序。此时,在不拆箱的前提下实现程序的远程升级,则显得尤为重要。 基于以上考虑,为了让嵌入式应用更简单 ,创龙科技(Tronlong)基于TI TMS320C6678平台提供了DSP程序远程升级方案:串口远程升级、网络远程升级。 1 硬件平台 本文基于创龙科技TL6678-EasyEVM评估板进行演示。 TL6678-EasyEVM是一款基于TI KeyStone架构C6000系列TMS320C6678八核C66x定点/浮点高性能处理器设计的高端多核DSP评估板,由核心板与底板组成。核心板经过专业的PCB Layout和高低温测试验证,稳定可靠,可满足各种工业应用环境。 评估板接口资源丰富,引出双路千兆网口、SRIO、PCIe等高速通信接口,方便用户快速进行产品方案评估与技术预研。 开发案例主要包括: (1) 裸机开发案例 (2) RTOS(SYS/BIOS)开发案例 (3) IPC、OpenMP 多核开发案例 (4) SRIO、PCIe、双千兆网口开发案例 (5) 图像处理开发案例 (6) DSP算法开发案例 (7) 串口、网络远程升级开发案例 案例源码、产品资料(用户手册

图像处理入门——扭曲

旧城冷巷雨未停 提交于 2021-01-07 07:58:52
图像的扭曲是按照一定的映射将像素点从原来的位置移动到新的位置,这种映射可以用复变函数表示 膨胀: 在极坐标下,设原来的坐标为(r,α),变换后的新坐标为(R,β): R = r * r * degree β = α 其中 degree 是可变参数。该映射使得图像向外扩张。下面是c#中的代码 /// <summary> /// 膨胀 /// </summary> /// <param name="bmp">要处理的图片</param> /// <param name="degree">扭曲的幅度</param> /// <returns>处理后的图片</returns> public Bitmap Distortion(Bitmap bmp, int degree) { Bitmap retBmp = bmp.Clone() as Bitmap; int width = bmp.Width; int height = bmp.Height; // 原点的x和y坐标 int midX = width / 2; int midY = height / 2; // 极坐标角度 double theta; // 极坐标半径 double radius; int offsetX, offsetY; int xx, yy; for (int y = 0; y < height; y++) { /