Skip to content

Conversation

@GreenHandHand
Copy link

由于 Infinicore 中的 Infinicore.zeros 暂时没有实现,这里7549959824de555ed6c829fde5d8726609cb3bb5 手动实现了 zeros_ 用于初始化。

描述

Infinicore 赛题 T1-1-25,算子 log10, avg_pool3d, histc, dot, log1p 的 cpu 实现,gpu 部分实现使用 ninetoothed,在 ntops 的 pr 中。

值得陈述的技术和细节

  1. ninetoothed 框架下暂时不知道如何实现 padding 方法,因此这里用的是直接拓展张量到对应的 padding 维度,并使用 narrow 和 copy_ 来创建目标张量。所以,对于无 padding 的输入,效率接近 pytorch,但是有 padding 的输入效率很低。
  2. histc 的实现借助了 triton.language.histogram 函数,但是这个函数在摩尔线程 gpu 上的实现是错误的,因此添加了is_moore 参数,在摩尔线程 gpu 上调用了不使用 histogram 函数的实现版本。

运行截图

cpu

summary log1p log10 avg_pool3d dot histc

nvidia

summary avg_pool3d dot histc log1p log10

摩尔线程

summary avg_pool3d dot histc log1p log10

沐曦

summary avg_pool3d dot histc log1p log10

天数

summary avg_pool3d dot histc log1p log10

HONOR_CODE

HONOR_CODE.md

@GreenHandHand GreenHandHand changed the title 2025 autumn green hand hand t1 1 25 [2025秋季][T1-1-25] GreenHandHand Dec 14, 2025
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment

Labels

None yet

Projects

None yet

Development

Successfully merging this pull request may close these issues.

1 participant