一个nvcc编译的小问题

news/2024/9/20 22:21:39

下面的cuda代码为什么指定compute capability = 8.0 后在A100上跑结果不对?

nvcc a.cu # 正确
nvcc a.cu -gencode arch=compute_80,code=sm_80 # 结果不正确
// a.cu
#include <cuda_runtime.h>
#include <stdio.h>
#include <stdlib.h>using ValueType = float;__constant__ ValueType col_idx[10];__global__ void aa_kernel(ValueType *x) {int idx = threadIdx.x;printf("idx = %d\n", idx);if(idx < 10)x[idx] = col_idx[idx];
}int main() {ValueType *col_h = new ValueType[10];col_h[0] = 1.0;for(int i=1; i<10; i++) col_h[i] = 2*col_h[i-1];ValueType * x_d;cudaError_t err = cudaSuccess;err = cudaMalloc(&x_d, 32*sizeof(ValueType));if(err != cudaSuccess) printf("error\n");cudaMemcpyToSymbol(col_idx, col_h, 10*sizeof(ValueType));cudaStream_t stream;cudaStreamCreate(&stream);aa_kernel<<<1, 32, 0, stream>>>(x_d);cudaDeviceSynchronize();ValueType x[32] = {0};cudaMemcpy(x, x_d, 32*sizeof(ValueType), cudaMemcpyDeviceToHost);for(int i=0; i<12; i++) printf("%f\n", x[i]);return 0;
}

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.ryyt.cn/news/62748.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈,一经查实,立即删除!

相关文章

opencascade Adaptor3d_Curve源码学习

opencascade Adaptor3d_Curve 前言用于几何算法工作的3D曲线的根类。 适配曲线是曲线提供的服务与使用该曲线的算法所需服务之间的接口。 提供了两个派生具体类:GeomAdaptor_Curve,用于Geom包中的曲线 Adaptor3d_CurveOnSurface,用于Geom包中表面上的曲线。 用于评估BSpline…

IDEA 换了电脑,如何导入和导出配置?

前言 我们在使用IDEA开发时,经常会设置各种各样的配置,时间一长,就会有很多个性化的东西。用起来也越来越顺手。不过这里可能会有个问题,那就是哪一天我们要换个电脑了,或者想安装新版本的IDEA时,又得重新配置下来。这复杂度堪比重装系统后的各种安装软件。那么,我们有没…

csp2024 游寄

不知不觉中,学OI已经一年了啊 day -\(\infty\) 打了一场模拟赛 喜提历史最好成绩:颓颓颓 day -6 做了一下去年的初赛 喜提57.5(SD分数线76 尸体不好了/tu day -5 又是模拟赛,达到历史最差成绩:不会打表导致的(确信 咋办啊有点慌。。。。。 day -4 开始去b站搜视频,搞初赛…

搭建免费的图床

当我们想创建一个小型的web应用时,如果图片资源放在服务器上,会影响带宽(也就是加载速度),尤其一些新手创业项目购买的服务器资源非常有限。这个时候如果还把图片资源放在服务器上会导致网页加载的非常缓慢。 这个时候就需要用的图片服务器。图片服务器有以下几种自己搭建…

9.20~

byd 模拟赛和那个造数据的!!!9.20 上午 晚上学校空调好像半夜就断电了( byd 之前用薄被子就给我冻醒 现在拿厚被子来就热死我是吧 😅 非常好模拟赛,使我的奥赛课旋转 3.4 h 打 3 道题…… t1 签到 t2 经典问题,神秘东西,打的朴素暴力跑路 t3 一眼分块扫描线然后发现跑…

opencascade Adaptor3d_CurveOnSurface源码学习

opencascade Adaptor3d_CurveOnSurface 前言用于连接由Geom包中表面上的曲线提供的服务,以及使用这条曲线的算法所要求的服务。该曲线被定义为一个二维曲线,来自Geom2d包,位于表面的参数空间中 方法 1 默认构造函数 Standard_EXPORT Adaptor3d_CurveOnSurface(); 2 通过给定…

Controller层

@RequestMapping(value = "/url",method = RequestMethod.POST) public String selectXXX(@RequestBody(required = false) String typeName){return ""; }I have a dream : Sandy beach B-J-N.

使用U盘PE重装Windows系统

1、概述 操作系统一般都是安装在硬盘内的,硬盘是一种存储数据的介质,U 盘同样也是一种存储数据的介质,因此也可以把操作系统安装进 U 盘里。 因为大部分 U 盘的性能比较差,不能流畅地运行完整版的操作系统,所以只能安装精简了大部分功能、只保留基本运行环境的简化版操作系…