首页 程序笔记 c#读取pdf里的表格

c#读取pdf里的表格

在C#中读取PDF文件中的表格需要使用一些第三方库来实现。其中比较常用的是iTextSharp和PDFSharp。

下面是使用iTextSharp库读取PDF文件中表格的示例代码:

using iTextSharp.text.pdf;
using iTextSharp.text.pdf.parser;

public static string ExtractTextFromPdf(string path)
{
    StringBuilder text = new StringBuilder();

    using (PdfReader reader = new PdfReader(path))
    {
        for (int i = 1; i <= reader.NumberOfPages; i++)
        {
            text.Append(PdfTextExtractor.GetTextFromPage(reader, i, new LocationTextExtractionStrategy()));
        }
    }

    return text.ToString();
}

要读取表格中的数据,可以使用iTextSharp的PdfReader对象的GetPageN方法获取指定页的PdfDictionary对象。然后使用PdfDictionary的GetAsArray方法获取该页的所有PdfObject对象。在这些PdfObject对象中查找PdfArray类型的对象,它们代表表格中的行和单元格。使用PdfArray的GetAsNumber和GetAsString方法获取单元格中的数据。

需要注意的是,这种方法只能读取PDF文件中的表格,如果需要修改或创建PDF文件中的表格,可以使用iTextSharp的PdfPTable和PdfPCell类。

PDFSharp库也提供了类似的功能,可以使用PdfSharp.Pdf.IO.PdfReader对象读取PDF文件中的表格数据。

4

站心网

在C#中读取PDF文件中的表格需要使用一些第三方库来实现。其中比较常用的是iTextSharp和PDFSharp。 下面是使..

为您推荐

.NET C# 读取编辑.AVIF图片文件

在 .NET 中读取和编辑 .AVIF 图片文件需要特定的库支持,因为 System.Drawing 等内置功能不直接支持 AVIF 格式。目前可以通过以下方式在 .NET 中实现对 AVIF 文件的读取和编辑:方法一:使用 ImageMagick 的 .NET 封..

解决.NET JAVA PHP中写入及读取memcache中数据不一致的方法

解决.NET JAVA PHP中写入及读取memcache中数据不一致的方法。公司部分接口使用PHP开发,部分接口使用.NET开放,.NET使用redis,PHP使用memcache作为分布式缓存服务器,但是部分业务需要.NET读取memcache里的数据。m..

.NET Core 读取配置文件方法

在.NET Core中使用appsettings.json配置文件。假设我们的示例配置文件是这样的{"Logging":{"LogLevel":{"Default":"Information","Microsoft":"Warning","Microsoft.Hosting.Lifetime":"Information"}},"AllowedHost..

.Net Core HttpClient读取GB2312网页乱码

.NET Core使用HttpClinet抓取网页,使用Encoding.UTF8.GetString(arr)方法获取网页内容时中文会变成乱码。但是如果改为Encoding.GetEncoding("gb2312").GetString()方法的话会报错:'gb2312' is not a supported enc..

C# Winform使用DataGridView显示表格数据

DataGridView的常见应用DataGridView是.NET框架中用于显示、编辑和操作数据表格的控件。它提供了一个灵活的方式来显示和操作大量的数据。以下是对DataGridView的一些常见应用和实现的总结:数据显示:DataGridView可..

C#使用ZXing.NET库识别读取条形码

在C#中识别和读取条形码通常需要使用专门的库或API。你可以使用一些流行的库来实现这个功能,比如ZXing(Zebra Crossing)。ZXing是一个开源的条形码图像处理库,它支持多种不同类型的条形码,包括二维码、EAN、Code..

PHP读取文件夹下所有文件

在 PHP 中,可以使用 opendir() 和 readdir() 函数来读取一个文件夹下所有文件。opendir() 函数用于打开一个文件夹,返回一个指向该文件夹的指针。readdir() 函数用于从一个文件夹中读取一个文件名,返回该文件名。..

js写入和读取cookie

在 JavaScript 中,你可以使用 document.cookie 来写入和读取 cookie。js写入Cookiedocument.cookie = "name=value; expires=date; path=path; domain=domain; secure";name=value:要存储的数据,以键值对的形式。e..

谷歌站点地图可读取,但存在错误 命名空间不正确

在使用谷歌Google search console提交站点地图sitemap.xml时,报错了:站点地图可读取,但存在错误命名空间不正确 1处您的站点地图或站点地图索引文件未能正确声明命名空间。示例第 1行标记:urlset虽然有报错,但是..

现代搜索引擎还读取meta-keywords和meta-description吗?

现代搜索引擎仍然会读取meta-keywords和meta-description标签,但它们在搜索排名算法中的权重已经大大降低了。meta-keywords 标签用于告诉搜索引擎您的网页内容与哪些关键字相关。在过去,meta-keywords 标签是搜索..

.NET Core MVC读取和修改appsettings.json配置文件

在 ASP.NET Core MVC 中,读取和修改 appsettings.json 配置文件是一个常见的操作。以下是如何实现的步骤:读取 appsettings.json 配置文件在构造函数中,创建一个 IConfiguration 对象。 可以使用以下代码创建配置..

使用C#读取USB HID设备的代码示例

在C#中,读取USB设备通常涉及到使用Windows的API,如SetupAPI和HidAPI。以下是一个基于HidAPI的示例,用于读取USB HID设备:using System;using HidLibrary;class Program{static void Main(string[] args){HidDevic..

发表回复

返回顶部