Visual Studio C/C++编译器cl.exe的/source-charset与/execution-charset设置项
Visual Studio C/C++编译器cl.exe的/source-charset与/execution-charset设置项
/source-charset选项
指定源代码的字符编码方法。未设置该项时,按照系统默认的字符编码解析源代码文件,例如在Windows平台是GBK编码。
随着跨平台开发的流行,越来越多的代码编辑器默认以utf-8编码保存源代码文件,因而需要将/source-charset
设置为utf-8以顺利编码其中的中文字符。
简而言之,开发者的C/C++工程所有源码文件应该使用统一的字符编码方法。然后将/source-charset设置为对应的方法名,保证编译正确。
特殊情况:在Windows平台中,源码文件都使用GBK或GB2312编码时,可以不必手动设置/source-charset项,亦可以正常在命令行输入、输出中文字符。
/execution-charset选项
顾名思义,执行字符集选项用于指定在编译完成的可执行程序(.exe)中字符串的编码方式。
在Windows平台默认依然是GBK编码。
GBK编码的中文字符串输出到默认代码页的CMD窗口,毫无问题;
然而某些时候需要将中文字符串输出到utf-8代码页的CMD窗口,这时不配置该选项就会乱码。
简而言之,编译程序时设定的/execution-charset值
应当与运行可执行程序的终端的字符编码
一致,以确保正常输出中文内容。
/source-charset和/execution-charset的设定格式
在选项后以冒号设置编码名或** .代码页编号 **:
例如:
/execution-charset:utf-8
等价于
/execution-charset:.65001
而/execution-charset:gbk
等价于/execution-charset:.936
,不再赘述。
冒号后跟的名称或编号可到微软文档查询。
/source-charset和/execution-charset的设置方法
打开项目的“属性”对话框。
选择“配置属性”>“C/C++”>“命令行”属性页,在“其他选项”中,添加/source-charset
或/execution-charset
等选项以指定首选编码,例如/execution-charset:utf-8
,最后点击“确定”以应用更改 。
在这两个选项需要同时设置为utf-8的场景下,可以直接在其他选项设置/utf-8
以代替/source-charset:utf-8和/execution-charset:utf-8
。
测试例程
#include <stdio.h>
#include <wchar.h>
#include <iostream>
#include <windows.h>
int main()
{printf("中文测试1 数字: %.2f\n", 1234.56); // 输出 "1234.56"// 获取当前代码页int idx = GetConsoleOutputCP(); // 获取当前代码页printf("当前代码页: %d\n", idx); // 输出当前代码页return 0;
}
在Windows平台下将这段代码以GB2312编码保存到文件,在VS中以默认选项编译得到可执行程序。在命令行运行该程序,可正常的输出中文结果:
中文测试1 数字: 1234.56
当前代码页:936
接下来,将命令行代码页切换到utf-8(运行命令chcp 65001
),再次运行程序,则输出乱码。因为控制台接收字节流之后,按utf-8解码成字符;而默认选项编译的程序中,字符串字节流是GB2312编码的,编码解码方式不匹配,自然会乱码。
最后,编译时设置/execution-charset:utf-8,则可观察到,编译得到的可执行程序在默认代码页的命令行输出乱码,在代码页65001的命令行中正确输出中文结果。
参考阅读
设置执行字符集