Orchid Blog

Seize the Moment.

My 2016

转眼间各大微信公众号,以及知乎大V都开始盘点2016的大小各事。转念一想,我也需要盘点这个显然不平凡的2016,不为他人展示,只为自己而作。 在地平线实习 做了万全准备后前往北京,心中激动又忐忑。出了鼓楼大街地铁站,第一次遇到被冷风吹得iPhone自动关机了,那时全靠手机地图查地铁线路的我,慌了阵脚。找到地平线大门过程不易,巧的是Mentor窝窝恰好出现在拐角,他一眼就认出了...

RETHINK

六余年磨砺,终见分晓。徘徊在大学与职场的交界线,愿来日顺利。 按照惯例,一篇好文章的诞生应该经历:确定主旨、梳理大纲、文如泉涌等几个步骤。但思来想去,我决定纯当随笔吧。 久未执笔,写作水平也下降了不少。一年来发生的事情如此繁多,却也历历在目,它们涉及了做事、选择、处世、的方方面面,这庞大的信息量,让我重新梳理做事准则。伴随着匆匆流逝的岁月,以身试错的成本会愈加让我们承担不起。步入...

GPU程序优化(四)——系统级别的优化

本文是GPU并行程序优化系列的第四部分,探究系统级相关的优化技巧。请参见“GPU程序优化”系列之前的文章。建议有一定的CUDA编程基础,再来阅读文本。 Catalog Host(CPU)-Device(GPU)的交互 流 Stream GPU优化总结 Host(CPU)-Device(GPU)的交互 固定的host memory CPU与GPU通过PCIe...

GPU程序优化(三)——矩阵转置程序优化实例(进阶版)

本文是GPU并行程序优化系列的第三部分,以矩阵转置为例,挖掘其在GPU上程序的进一步优化。之前关于本例的初步优化请参见“GPU程序优化(二)”一文。建议有一定的CUDA编程基础,再来阅读文本。 Catalog 已经达到极限了? 影响代码性能的两个主要方面 优化代码内存操作 看代码内存操作是否有效——DRAM utilization ...

GPU程序优化(二)——矩阵转置程序优化实例

本文是GPU并行程序优化系列的第二部分,以矩阵转置为例,探究其在GPU上的程序优化过程。优化的基本原则请参加“GPU程序优化(一)——基本概念”一文。建议有一定的CUDA编程基础,再来阅读文本。 矩阵转置的例子,虽然简单,但涵盖了很多内容,更是对一些优化原则的实际运用,加深对其印象。 Catalog 矩阵转置程序目的 C代码实现——串行代码 第1个cuda版本实现...

GPU程序优化(一)——基本概念

本文是GPU并行程序优化系列的第一部分,介绍GPU编程原则、优化层次,及优化的基本流程,建立起优化概念。建议有一定的CUDA编程基础,再来阅读文本。不多说什么,Let’s go ahead! 今天我们谈谈GPU程序优化。我们想要使用并行平台(GPU)的原因就是为了更快地解决问题,或高效地解决更大、更多的问题。用GPU获得加速是一件很酷的事儿,但也意味着要做额外的努力来最大化速度。往...

ARM NEON优化(二)——NEON编程, 优化心得及内联汇编使用心得

本文旨在介绍ARMv7开始增加的一项advanced SIMD extension——NEON技术。有助于帮助读者理解NEON概况,提供的实例分析有助于迅速上手NEON编程。阅读此文要求读者有基本的C/C++经验及汇编代码经验,若没有也没关系,多理解查阅资料即可。 关于第一讲请见ARM NEON优化(一)——NEON简介及基本架构Good luck~! Catalog ...

ARM NEON优化(一)——NEON简介及基本架构

本文旨在介绍ARMv7开始增加的一项advanced SIMD extension——NEON技术。有助于帮助读者理解NEON概况,提供的实例分析有助于迅速上手NEON编程。阅读此文要求读者有基本的C/C++经验及汇编代码经验,若没有也没关系,多理解查阅资料即可。Good luck~! Catalog SIMD及NEON概览 NEON架构(寄存器/数据类型/指令集)...

图像旋转优化(二)——以Android中YUV422I旋转算法为例

在上一篇博文里介绍了图像处理初探(一)——图像转换基础及OpenCV应用,本篇在此基础上重点谈图像旋转算法的原理与实现。本文以Android中常见的YUV422I(YUY2)格式为例。 Catalog 通用YUV422I旋转90/270算法 通用YUV422I旋转0/180算法 完善算法以支持不规则尺寸图像的旋转 更加省时的图像旋转 通用YUV422I旋...

图像处理初探(一)——图像转换基础及OpenCV应用

近日做了些与OpenCV、图像处理相关的工程,两个周的时间收获了挺多,故将涉及到的内容进行整理,方便以后查阅,共同学习。 本文主要介绍OpenCV使用、图像格式相关的内容。 Catalog OpenCV2.4.10 + Win10 VS2015的安装配置 OpenCV基本用法 RGB/YUV色彩空间 常见图像格式 OpenCV2.4.10 + Win10...