兄弟们,最近折腾了个事儿,真给我整兴奋了。以前写数据处理脚本,几百万条记录,CPU跑得跟蜗牛似的,忍了很久。昨晚突发奇想,试了试NVIDIA的cupy库,直接把numpy代码改两行,丢到GPU上跑。结果?同样的循环,原来要45秒,现在0.8秒就干完了!😱
别误会,不是所有场景都适合,得是那种矩阵运算多的活儿。但如果你跟我一样,天天跟数组、矩阵打交道,真心建议试试。cupy接口跟numpy几乎一模一样,迁移成本低到哭。唯一坑的是,显存不够别硬来,我1060的6G显存,跑个1亿条数据就炸了。
新手别上来就搞这个,先把CPU版本调优再说。老鸟们,还有啥类似的黑科技?求推荐,最近对加速上瘾了。 |