比Spark快100倍的GPU加速SQL引擎!BlazingSQL开源了
越小越好 运行以下 Colab 演示,用户可以使用免费英伟达 T4 GPU 资源进行同样的测试,对 BlazingSQL 的实际效果进行验证: https://colab.research.google.com/drive/1EbPE9FwFur7fE2054BH9s23Kd0FiUgGo 据 介绍,BlazingSQL 大部分性能提升来自团队的内部引擎项目,BlazingSQL 团队的工程师们希望开发一种专为 GPU DataFrames(GDF)构建的 GPU 执行内核,称之为“SIMD 表达式解释器”(SIMD Expression Interpreter)。研发团队分享了一些关于 SIMD 表达式解释器的细节,SIMD 表达式解释器通过几个关键步骤带来提升性能:
目前,SIMD 表达式解释器支持 BlazingSQL 的过滤和投影,因此它对许多主流的 SQL 查询都有影响。 使用 BlazingSQL 在 Amazon S3 中查询 CSV 文件的示例代码:
更多 BlazingSQL 的操作方法参见: GitHub 项目链接:https://github.com/blazingdb/pyBlazing/ 官方网站:https://docs.blazingdb.com/docs/using-blazingsql (编辑:西安站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |