首页 程序笔记 'gb2312' is not a supported encoding name. For information on defining a custom encoding

'gb2312' is not a supported encoding name. For information on defining a custom encoding

.NET Core使用HttpClinet抓取网页,使用Encoding.GetEncoding("gb2312").GetString(arr)方法获取网页内容时报错:'gb2312' is not a supported encoding name. For information on defining a custom encoding, see the documentation for the Encoding.RegisterProvider method. (Parameter 'name')。

代码如下:

var handler = new HttpClientHandler() { AutomaticDecompression = System.Net.DecompressionMethods.GZip };
using (HttpClient client = new HttpClient(handler)) {
    var res = await client.GetAsync(Url);
    var arr = await res.Content.ReadAsByteArrayAsync();
    var str = Encoding.GetEncoding("gb2312").GetString(arr);
}

解决方法是安装System.Text.Encoding.CodePages包,然后注册provider。

EncodingProvider provider = CodePagesEncodingProvider.Instance;
Encoding.RegisterProvider(provider);
var handler = new HttpClientHandler() { AutomaticDecompression = System.Net.DecompressionMethods.GZip };
using (HttpClient client = new HttpClient(handler)) {
    var res = await client.GetAsync(Url);
    var arr = await res.Content.ReadAsByteArrayAsync();
    var str = Encoding.GetEncoding("gb2312").GetString(arr);
}

如果使用Encoding.UTF8.GetEncoding虽然不会报错,但是因为网页的content-type是charset=gb2312,所以网页中的中文会变成乱码。

后来又尝试了一些其他的方法,发现不管使用ReadAsByteArrayAsync,ReadAsStreamAsync还是ReadAsStringAsync,如果碰到这种编码的都需要安装这个包才能避免报错和避免乱码。

参考文章:https://www.leavescn.com/Articles/Content/1284

如果有更好的办法,请留言分享,谢谢。

5

站心网

.NET Core使用HttpClinet抓取网页,使用Encoding.GetEncoding("gb2312").GetString(arr)方法获取网页内容时..

为您推荐

无法加载文件或程序集 'XXXXX' 或其依赖项。访问被拒绝

遇到 “无法加载文件或程序集 'XXXXX' 或其依赖项。访问被拒绝” 错误时,通常是由于权限问题或文件夹、程序集引用配置不当所引起。下面是一些常见的原因及解决方法:1. 文件或程序集权限问题如果服务器或..

AUC is not defined when there is no positive class in the data (Parameter 'PosSample')

使用ML.NET训练模型后,使用测试数据评估模型,验证模型的性能。执行Evaluate方法时报错:AUC is not defined when there is no positive class in the data (Parameter 'PosSample')。这个错误信息也不知道什么原因..

EF Core 8 (EF8) Contains报错:Microsoft.Data.SqlClient.SqlException (0x80131904): 关键字 'WITH' 附近有语法错误。

最近将原来.NET6的项目升级到.NET8,用的EF Core版本也相应升级到EF8版本,在查询数据的时候使用Contains运算符的地方报错了。Microsoft.Data.SqlClient.SqlException (0x80131904): 关键字 'WITH' 附近有语法错误。..

使用 Let's Encrypt 在 Ubuntu 22.04 上安装 CyberPanel

CyberPanel 是一个构建在 OpenLiteSpeed Web 服务器上的开源控制面板。它作为开源解决方案发布,整个团队都提供支持。 CyberPanel 提供一键式设置来安装流行的 Web 框架,例如 Joomla、WordPress、Drupal、Mautic 等..

System.ArgumentOutOfRangeException: Token 2000000 is not valid in the scope of module System.ModuleHandle. (Parameter 'typeToken')

运行.NET Core MVC站点的时候报错:System.ArgumentOutOfRangeException: Token 2000000 is not valid in the scope of module System.ModuleHandle. (Parameter 'typeToken')这个异常通常在 .NET 平台中出现,特别..

Qt编译报错:error: LNK1181: cannot open input file 'debugmain.obj'

问题描述拿到一个别人提供的Qt工程,编译时报错:error: LNK1181: cannot open input file ‘debugmain.obj’,Google上搜索了一下,找到问题的原因,这里记录备忘。解决办法我这个项目报这个错误的主要原因是项目的..

QT编译时报错 error: lnk1158: cannot run 'rc.exe'

问题描述拿到别人写的一个Qt程序,编译时报错: -1: error: lnk1158: cannot run ‘rc.exe’,折腾了一下,找到解决的办法如下。解决办法通过路径找到rc.exe,不过,这个有两个版本,一个是x86和x64。可以在windows中..

Qt编译C++报错:error: 'nullptr' was not declared in this scope

问题描述网上下载了一个Qt项目了的源码,在Linux中执行qmake,再执行make时编译报错:error: ‘nullptr’ was not declared in this scope,其中“nullptr”是C++中的关键字,这里居然找不到,在google中搜索了一下..

飞飞cmsAccess denied for user 'root'@'localhost' (using password: YES)

[pfc]删除runtime以下目录的两个文件,同时再重新修改下config.php的权限为777试试runtime/~app.php~runtime.php[/pfc]

发表回复

返回顶部