咨询与建议

限定检索结果

文献类型

  • 3 篇 期刊文献
  • 1 篇 学位论文

馆藏范围

  • 4 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 4 篇 工学
    • 2 篇 信息与通信工程
    • 2 篇 计算机科学与技术...
    • 1 篇 机械工程
    • 1 篇 软件工程
  • 1 篇 军事学
    • 1 篇 军队指挥学

主题

  • 4 篇 通用矩阵乘法
  • 2 篇 并行计算
  • 1 篇 armv8多核处理器
  • 1 篇 libshalom
  • 1 篇 静默数据损坏
  • 1 篇 校验和
  • 1 篇 成像系统
  • 1 篇 基于算法的容错
  • 1 篇 检错与纠错
  • 1 篇 浮点运算
  • 1 篇 快速卷积算法
  • 1 篇 深度学习
  • 1 篇 性能评测与优化
  • 1 篇 高光谱图像
  • 1 篇 图形处理器

机构

  • 1 篇 中国科学院大学
  • 1 篇 飞腾信息技术有限...
  • 1 篇 天津大学
  • 1 篇 国防科技大学
  • 1 篇 上海海洋大学
  • 1 篇 上海电力大学
  • 1 篇 中国科学院空间应...

作者

  • 1 篇 宋巍
  • 1 篇 赵亚飞
  • 1 篇 杨维铃
  • 1 篇 黄冬梅
  • 1 篇 邹亚晴
  • 1 篇 杨耀功
  • 1 篇 张善从
  • 1 篇 魏继增
  • 1 篇 刘智翔
  • 1 篇 包冲
  • 1 篇 张明华
  • 1 篇 王永刚

语言

  • 4 篇 中文
检索条件"主题词=通用矩阵乘法"
4 条 记 录,以下是1-10 订阅
排序:
面向GPU的通用矩阵乘法计算的容错研究
收藏 引用
微电子学与计算机 2021年 第1期38卷 22-26,32页
作者: 包冲 张善从 中国科学院大学 北京100049 中国科学院空间应用工程与技术中心 北京100094
矩阵计算是GPU最擅长的工作之一,NVIDIA公司在CUDA中提供了线性代数库cuBLAS,用于矩阵和向量相关的计算.但是GPU容易受到电磁或者宇宙射线影响,而发生"位"反转问题,从而发生静默数据损坏错误.针对这个问题,利用基于算法的容错方法,提出... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
GGCN:基于GPU的高光谱图像分类算法
收藏 引用
激光与光电子学进展 2020年 第20期57卷 223-229页
作者: 张明华 邹亚晴 宋巍 黄冬梅 刘智翔 上海海洋大学信息学院 201306 上海电力大学电子与信息工程学院 上海200090
高光谱图像分类是遥感领域的研究热点之一,是对地观测的重要手段,在地物的精细识别等领域具有重要的应用。使用卷积神经网络(CNN)可以有效地从原始图像中提取高级特征,具有较高的分类精度。但CNN计算量巨大,对硬件要求较高。为了提高模... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 评论
面向飞腾处理器平台的快速卷积算法优化
收藏 引用
上海理工大学学报 2024年 第6期46卷 610-619页
作者: 赵亚飞 杨耀功 王永刚 魏继增 天津大学智能与计算学部 天津300354 飞腾信息技术有限公司 天津300459
为解决卷积神经网络难以在计算资源受限设备上部署的问题,面向国产FT-2000/4多核处理器提出一种高性能的快速卷积算法FastInfer。采用分块策略优化通用矩阵乘法,将处理器访问频率高的数据存入更靠近处理器的缓存中,从而提高计算过程中... 详细信息
来源: 维普期刊数据库 维普期刊数据库 同方期刊数据库 同方期刊数据库 同方期刊数据库 同方期刊数据库 评论
面向ARMv8多核处理器的小规模及不规则矩阵乘性能优化技术研究
面向ARMv8多核处理器的小规模及不规则矩阵乘性能优化技术研究
收藏 引用
作者: 杨维铃 国防科技大学
学位级别:硕士
通用矩阵-矩阵乘法(GEMM,GEneral Matrix Multiply)是高性能计算领域中最关键的例程之一,也是高性能线性代数库(BLAS,Basic Linear Algebra Subprograms)的核心操作。尽管现有BLAS库可以在大规模GEMM上取得接近处理器峰值的性能,但在小... 详细信息
来源: 同方学位论文库 同方学位论文库 评论