Tag Archives: 汇编

最近都流行实现 Coroutine 么？

Posted on 2019/08/10 by skywind

这两天看着大家都在实现无栈的 coroutine 都挺好玩的，但无栈协程限制太多，工程实践上很少用，所以昨天手痒写了个有栈的 coroutine ，接口反照 ucontext 的接口，不比无栈的复杂多少： int main(void) { ctx_context_t r; int hr; volatile int mode = 0; hr = ctx_getcontext(&r); printf(“ctx_getcontext() -> %d\n”, hr); if (mode == 0) { mode++; printf(“first run\n”); ctx_setcontext(&r); } else { printf(“second run\n”); … Continue reading →

Posted in 编程技术 | Tagged 汇编 | Leave a comment

计算机底层是如何访问显卡的？

Posted on 2016/06/17 by skywind

以前 DOS下做游戏，操作系统除了磁盘和文件管理外基本不管事情，所有游戏都是直接操作显卡和声卡的，用不了什么驱动。虽然没有驱动，但是硬件标准还是放在那里，VGA, SVGA, VESA, VESA2.0 之类的硬件标准，最起码，你只做320x200x256c的游戏，或者 ModeX 下 320x240x256c 的游戏的话，需要用到VGA和部分 SVGA标准，而要做真彩高彩，更高分辨率的游戏的话，就必须掌握 VESA的各项规范了。翻几段以前写的代码演示下：例子1：初始化 VGA/VESA 显示模式基本是参考 VGA的编程手册来做： INT 10,0 – Set Video Mode AH = 00 AL = 00 40×25 B/W text (CGA,EGA,MCGA,VGA) = 01 40×25 16 … Continue reading →

Posted in 图形编程 | Tagged 图形, 汇编 | 2 Comments

BasicBitmap：比 SDL/DirectDraw/GDI 更快的位图库

Posted on 2016/04/29 by skywind

开源一个高性能位图库，之前对我的二维图形库 pixellib 的部分代码进行了精简和重写，最终形成一个只包含两个文件（BasicBitmap.h, BasicBitmap.cpp）的图形基础库。在今天 GPU 绘制横行天下的时候，任然有很多时候需要使用到纯 CPU实现的图形库，比如图像处理，视频预处理与合成，界面，以及GPU无法使用的情况（比如某个应用把gpu占满了，或者无法通过gpu做一些十分灵活的事情时），纹理处理，简单图片加载保存等。支持 SSE2/AVX 优化，比 DirectDraw 快 40%（全系统内存绘制），比 SDL 快 10%，比GDI快 38%。如果你需要一个方便的高性能位图库，足够高性能的同时保证足够紧凑。如果你有上述需求，那么你和我一样需要用到 BasicBitmap，只需要把 BasicBitmap.h/.cpp 两个文件拷贝到你的代码中即可。我正是为了这个目的编写了这两个文件。项目地址 https://github.com/skywind3000/BasicBitmap 特性介绍高度优化的 C++ 代码，可以在任意平台编译并运行多重像素格式，从8位到32位：A8R8G8B8, R8G8B8, A4R4G4B4, R5G6B5, A8, 等. Blit (Bit Blt) ，包含透明和非透明的模式。像素格式快速转换使用不同的 … Continue reading →

Posted in 图形编程 | Tagged 优化, 图形, 汇编 | 2 Comments

内存拷贝优化（3）-深入优化

Posted on 2015/12/20 by skywind

今天继续在原来内存拷贝代码上优化： 1. 修改了小内存方案：由原来64字节扩大为128字节，由 int 改为 xmm，小内存性能提升 80% 2. 修改了中内存方案：从4个xmm寄存器并行拷贝改为8个并行拷贝+prefetch，提升20%左右 3. 去除目标地址头部对齐的分支判断，用一次xmm拷贝完成目标对齐，性能替升10%。 4. 增加测试用例：为贴近实际，增加了随机访问，10MB空间内（绝对大于L2尺寸）随机位置和长度的测试为避免随机数生成影响结果，提前生成随机数，最终平均性能达到gcc4.9配套标准库的2倍以上： https://github.com/skywind3000/FastMemcpy 最新代码测试结果（可以对比老的表看新版本性能是否有所提升）：

Posted in 编程技术 | Tagged 优化, 汇编 | 5 Comments

内存拷贝优化（2）-全尺寸拷贝优化

Posted on 2015/12/18 by skywind

四年前写过一篇小内存拷贝优化：http://www.skywind.me/blog/archives/143 纠结了一下还是把全尺寸拷贝优化代码发布出来吧，没啥好保密的，如今总结一下全尺寸内存拷贝优化的要点： 1. 策略区别：64字节以内用小内存方案，64K以内用中尺寸方案，大于64K用大内存拷贝方案。 2. 查表跳转：拷贝不同小尺寸内存，直接跳转到相应地址解除循环。 3. 目标对齐：64字节以上拷贝的先用普通方法拷贝几个字节让目标地址对齐，好做后面的事情。 4. 矢量拷贝：并行一次性读入N个矢量到 sse2 寄存器，再并行写出。 5. 缓存预取：使用 prefetchnta ，提前预取数据，等到真的要用时数据已经到位。 6. 内存直写：使用 movntdq 来直写内存，避免缓存污染。部分理论，见论文：《Using Block Prefetch for Optimized Memory Performance》但论文考虑问题比较单一，所以实际代码写的比论文复杂不少，目前在各个尺寸上基本平均能够加速 40%，比较GCC 4.9, VS2012的 memcpy，不排除未来的 libc, crt库继续完善以后，能够达到下面代码的速度。但我看libc和crt的 memcpy代码已经很久没人更新了，不知道他们还愿意继续优化下去么？行了，具体实现各位读代码吧，需要 SSE2 … Continue reading →

Posted in 编程技术 | Tagged 优化, 汇编 | 1 Comment

转换 Intel汇编格式到 AT&T汇编风格

Posted on 2015/04/10 by skywind

常用 MSVC写内嵌汇编需要兼容 GCC是一件头疼的事情，不是说你不会写 GCC的 AT&T风格汇编，而是说同一份代码写两遍，还要调试两遍，是一件头疼的事情，特别是汇编写了上百行的时候。于是五年前写过一个小工具，可以方便的进行转换，能把 MSVC/MASM的汇编转成纯 AT&T风格汇编，或者 GCC Inline风格汇编，自动识别寄存器和变量，还有跳转地址，并且自动导出。今天把他放上来，或许有用到的人吧。

Posted in 编译原理 | Tagged 汇编, 词法分析, 语法分析 | 1 Comment

[自制开源] 轻量级图形库 PixelLib

Posted on 2010/01/10 by skywind

图像：64种不同的像素格式，色彩空间变换，多种图形图像变换。质量：支持3种级别抗锯齿效果，高质量几何图形绘制。实现：轻量级纯软件实现，100% C代码（仅700KB代码）。优化：SSE2/MMX优化地址：https://github.com/skywind3000/pixellib 1. 图像变换：支持仿射变换和透视变换，提供大量图像变换操作接口。

Posted in 图形编程, 开源项目, 游戏开发, 编程技术 | Tagged 图形, 抗锯齿, 汇编, 矢量作图 | 7 Comments

[业余土制] 实时汇编编译器

Posted on 2009/07/05 by skywind

实时动态在内存中编译汇编代码，并返回函数调用指针，可用于JIT系统的后端：项目地址：http://code.google.com/p/asmpure/ 例子： const char *AlphaBlendAsm = “PROC C1:DWORD, C2:DWORD, A:DWORD\n” ” movd mm0, A\n” ” punpcklwd mm0, mm0\n” ” punpckldq mm0, mm0\n” ” pcmpeqb mm7, mm7\n” ” psubw mm7, mm0\n” ” \n” ” punpcklbw mm1, C1\n” ” psrlw mm1, … Continue reading →

Posted in 开源项目, 编程技术, 编译原理 | Tagged 汇编, 词法分析 | 3 Comments

Tag Archives: 汇编

最近都流行实现 Coroutine 么？

计算机底层是如何访问显卡的？

BasicBitmap：比 SDL/DirectDraw/GDI 更快的位图库

内存拷贝优化（3）-深入优化

内存拷贝优化（2）-全尺寸拷贝优化

转换 Intel汇编格式到 AT&T汇编风格

[自制开源] 轻量级图形库 PixelLib

[业余土制] 实时汇编编译器

Random Posts

Categories

Recent Comments

Links

Meta

Archives

Tag Archives: 汇编

Random Posts

Tags

Categories

Recent Comments

Links

Meta

Archives