首页 程序笔记 .NET自然语言转换为SQL的Nl2Sql项目

.NET自然语言转换为SQL的Nl2Sql项目

随着技术的发展,人工智能在各个领域的应用已经不再是新鲜事。在数据库查询领域能够自然地将人类语言转换为SQL语句将为不懂技术的人士提供极大的便捷,同时也能大幅提高专业开发者的工作效率。今天,我带大家深入了解一个非常有趣的项目——Nl2Sql,这个项目是基于.NET平台和Semantic Kernel的工具,它可以将自然语言转换为SQL查询语句。

Nl2Sql GitHub地址:https://github.com/microsoft/kernel-memory/tree/NL2SQL/examples/200-dotnet-nl2sql

GPT-4的出现,使得基于自然语言处理的技术跨越了一个新的门槛,尤其是在自然语言转换成SQL语句的能力上有了显著提升。Nl2Sql工具就是利用GPT-4和Semantic Kernel的强大功能,为我们提供了一个实验和测试平台,能够基于自然语言表达生成SQL查询语句。

项目结构与样例信息

在开源的Nl2Sql项目中,我们可以看到以下几个组成部分:

nl2sql.config - 包含了设置说明、数据模式和语义提示。 nl2sql.console - 控制台应用,用于将自然语言目标转换成SQL查询。 nl2sql.library - 支持库,同样用于自然语言到SQL的转换。 nl2sql.harness - 开发调试工具,用于实时逆向工程化数据库模式。 nl2sql.sln - Visual Studio解决方案文件。

运行样例的第一步是进行初始设置和配置。

核心方法解析

我们来看一看Nl2Sql功能的实现关键。该程序采用.NET的开发框架,通过一系列方法来完成从输入的自然语言到输出的SQL查询的转换。这个过程涉及到自然语言理解、数据库模式解析和查询生成等环节。

private async Task ExecuteConsoleAsync(CancellationToken stoppingToken)
{
 var schemaNames = SchemaDefinitions.GetNames().ToArray();
 await SchemaProvider.InitializeAsync(
 this._memory,
 schemaNames.Select(s => Path.Combine(Repo.RootConfigFolder, "schema", $"{s}.json"))).ConfigureAwait(false);

 this.WriteIntroduction(schemaNames);

 while (!stoppingToken.IsCancellationRequested)
 {
 var objective = await ReadInputAsync().ConfigureAwait(false);
 if (string.IsOrWhiteSpace(objective))
 {
 continue;
 }

 var result =
 await this._queryGenerator.SolveObjectiveAsync(objective).ConfigureAwait(false);

 await ProcessQueryAsync(result).ConfigureAwait(false);
 }

 this.WriteLine();

 // Capture console input with cancellation detection
 async Task<string?> ReadInputAsync()
 {
 this.Write(SystemColor, "# ");

 var inputTask = Console.In.ReadLineAsync(stoppingToken).AsTask();
 var objective = await inputTask.ConfigureAwait(false);

 // response occurs when blocking input is cancelled (CTRL+C)
 if ( == objective)
 {
 this.WriteLine();
 this.WriteLine(FocusColor, "Cancellation detected...");

 // Yield to sync stoppingToken state
 await Task.Delay(TimeSpan.FromMilliseconds(300), stoppingToken).ConfigureAwait(false);
 }
 else if (string.IsOrWhiteSpace(objective))
 {
 this.WriteLine(FocusColor, $"Please provide a query related to the defined schemas.{Environment.NewLine}");
 }
 else
 {
 this.ClearLine(previous: true);
 this.WriteLine(QueryColor, $"# {objective}");
 }

 return objective;
 }

 // Display query result and (optionally) execute.
 async Task ProcessQueryAsync(SqlQueryResult? result)
 {
 if (result == )
 {
 this.WriteLine(FocusColor, $"Unable to translate request into a query.{Environment.NewLine}");
 return;
 }

 this.WriteLine(SystemColor, $"{Environment.NewLine}SCHEMA:");
 this.WriteLine(QueryColor, result.Schema);
 this.WriteLine(SystemColor, $"{Environment.NewLine}QUERY:");
 this.WriteLine(QueryColor, result.Query);

 if (!this.Confirm($"{Environment.NewLine}Execute?"))
 {
 this.WriteLine();
 this.WriteLine();
 return;
 }

 await Task.Delay(300, stoppingToken).ConfigureAwait(false); // Human feedback window

 this.ClearLine();
 this.Write(SystemColor, "Executing...");

 await ProcessDataAsync(
 result.Schema,
 result.Query,
 reader =>
 {
 this.ClearLine();
 this.WriteData(reader);
 }).ConfigureAwait(false);
 }

 // Execute query and display the resulting data-set.
 async Task ProcessDataAsync(string schema, string query, Action<IDataReader> callback)
 {
 try
 {
 using var connection = await this._sqlProvider.ConnectAsync(schema).ConfigureAwait(false);
 using var command = connection.CreateCommand();

#pragma warning disable CA2100 // Review SQL queries for security vulnerabilities
 command.CommandText = query;
#pragma warning restore CA2100 // Review SQL queries for security vulnerabilities

 using var reader = await command.ExecuteReaderAsync(stoppingToken).ConfigureAwait(false);
 callback.Invoke(reader);
 }
#pragma warning disable CA1031 // Do not catch general exception types
 catch (Exception exception)
#pragma warning restore CA1031 // Do not catch general exception types
 {
 this.ClearLine();
 this.WriteLine(FocusColor, exception.Message);
 }
 }
}

代码结构非常清晰,主要包含数据读取、SQL命令执行、命令行输入处理和数据展示等功能。整个转换过程使用了异步编程模式,保证了良好的用户交互体验和程序性能。

用户交互设计

在用户交互方面,该程序展现了良好的设计。用户可以在控制台中输入自然语言描述的目标,程序会解析这一描述并生成对应的SQL查询。如果成功生成,还会提供是否执行查询的选项,在用户确认后,能够将查询结果以格式化的方式显示在控制台上。

数据展示和交互

在数据展示方面,开发人员精心设计了一整套显示系统,能够将查询结果分页显示,同时考虑到了窗口宽度和数据字段宽度的问题,确保了数据显示的友好性和阅读性。

private void WriteData(IDataReader reader)
{
 int maxPage = Console.WindowHeight - 10;

 var widths = GetWidths().ToArray();
 var isColumnTruncation = widths.Length < reader.FieldCount;
 var rowFormatter = string.Join('│', widths.Select((width, index) => width == -1 ? $"{{{index}}}" : $"{{{index},-{width}}}"));

 if (isColumnTruncation)
 {
 rowFormatter = string.Concat(rowFormatter, isColumnTruncation ? $"│{{{widths.Length}}}" : string.Empty);
 }

 WriteRow(GetColumns());

 WriteSeparator(widths);

 bool showData;

 do
 {
 int count = 0;
 while (reader.Read() && count < maxPage)
 {
 WriteRow(GetValues());

 count++;
 }

 if (count >= maxPage)
 {
 showData = this.Confirm($"...More?");
 this.ClearLine();
 if (!showData)
 {
 this.WriteLine();
 }
 }
 else
 {
 showData = false;
 this.WriteLine();
 }
 } while (showData);

 void WriteRow(IEnumerable<string> fields)
 {
 fields = TrimValues(fields).Concat(isColumnTruncation ? new[] { "..." } : Array.Empty<string>());

 this.WriteLine(SystemColor, rowFormatter, fields.ToArray());
 }

 IEnumerable<string> TrimValues(IEnumerable<string> fields)
 {
 int index = 0;
 int totalWidth = 0;

 foreach (var field in fields)
 {
 if (index >= widths.Length)
 {
 yield break;
 }

 var width = widths[index];
 ++index;

 if (width == -1)
 {
 var remainingWidth = Console.WindowWidth - totalWidth;

 yield return TrimValue(field, remainingWidth);
 yield break;
 }

 totalWidth += width + 1;

 yield return TrimValue(field, width);
 }
 }

 string TrimValue(string? value, int width)
 {
 value ??= string.Empty;

 if (value.Length <= width)
 {
 return value;
 }

 return string.Concat(value.AsSpan(0, width - 4), "...");
 }

 void WriteSeparator(int[] widths)
 {
 int totalWidth = 0;

 for (int index = 0; index < widths.Length; index++)
 {
 if (index > 0)
 {
 this.Write(SystemColor, "┼");
 }

 var width = widths[index];

 this.Write(SystemColor, new string('─', width == -1 ? Console.WindowWidth - totalWidth : width));

 totalWidth += width + 1;
 }

 if (isColumnTruncation)
 {
 this.Write(SystemColor, "┼───");
 }

 this.WriteLine();
 }

 IEnumerable<int> GetWidths()
 {
 if (reader.FieldCount == 1)
 {
 yield return -1;
 yield break;
 }

 int totalWidth = 0;

 for (int index = 0; index < reader.FieldCount; ++index)
 {
 if (index == reader.FieldCount - 1)
 {
 // Last field gets remaining width
 yield return -1;
 yield break;
 }

 var width = GetWidth(reader.GetFieldType(index));

 if (totalWidth + width > Console.WindowWidth - 11)
 {
 yield break;
 }

 totalWidth += width;

 yield return width;
 }
 }

 static int GetWidth(Type type)
 {
 if (!s_typeWidths.TryGetValue(type, out var width))
 {
 return 16; // Default width
 }

 return width;
 }

 IEnumerable<string> GetColumns()
 {
 for (int index = 0; index < reader.FieldCount; ++index)
 {
 var label = reader.GetName(index);

 yield return string.IsOrWhiteSpace(label) ? $"#{index + 1}" : label;
 }
 }

 IEnumerable<string> GetValues()
 {
 for (int index = 0; index < reader.FieldCount; ++index)
 {
 yield return reader.GetValue(index)?.ToString() ?? string.Empty;
 }
 }
}

整个程序对于输入的处理非常人性化,如果用户输入了无关的或格式不正确的指令,程序会给出相应的提示,引导用户重新输入。

结语

Nl2Sql项目不仅展示了现代AI技术的强大能力,也体现了.NET生态在人工智能应用中的活跃度,并且推动了开发者之间的技术互助和分享。Nl2Sql证明了在未来,我们可以期待更多的自然语言处理工具来帮助我们更好地与数据交互。

2

站心网

随着技术的发展,人工智能在各个领域的应用已经不再是新鲜事。在数据库查询领域能够自然地将人类语言转换为..

为您推荐

.NET C# 过滤从富文本编辑器html里的Javascript脚本

富文本编辑器在允许用户输入丰富内容的同时,也带来了跨站脚本攻击(XSS)的风险。过滤提交的 HTML 中的 <script> 脚本是防止跨站脚本攻击(XSS)的关键步骤。在 .NET C# 服务端过滤 <script> 脚本主要有以下几种方..

ZLinq:.NET 高性能 LINQ 替代方案及其使用指南

在 .NET 开发中,LINQ(Language Integrated Query)为数据查询提供了简洁且强大的语法。然而,传统的 LINQ 在处理大量数据时可能会引发性能瓶颈,主要由于频繁的内存分配和对象创建。为解决这一问题,Cysharp 团队..

.NET使用AutoMapper简化对象映射

在.NET软件开发中,常常需要将一个对象的数据转换并映射到另一个对象上。​这种手动映射的过程既繁琐又容易出错,影响开发效率和代码可维护性。​为了解决这一问题,AutoMapper应运而生。​什么是 AutoMapper?AutoM..

.NET C# RESTful API交互Refit库使用教程

Refit 是一个 .NET C# 库,它简化了与 RESTful API 的交互。Refit 受到 Square 的 Retrofit 库的启发,它将 REST API 转换为实时接口,允许你以声明方式定义 REST API 调用。Refit 的特点1. 声明式 API 定义:Refit ..

.NET C# System.Text.Json进阶使用技巧

System.Text.Json 是 .NET 中用于处理 JSON 数据的强大库。除了基本用法外,它还提供了许多进阶技巧,可以帮助你更高效、更灵活地处理 JSON 数据。以下是一些 System.Text.Json 的进阶使用技巧:1. 自定义序列化和反..

.NET Core 使用ML.NET 机器学习分析预测股票走势

在 .NET Core 中,你可以利用 ML.NET 框架来构建机器学习模型,以预测股票价格走势。以下是一个基本的实现步骤:​1. 准备数据:​收集并整理股票的历史数据,包括日期、开盘价、最高价、最低价、收盘价和成交量等信..

.NET 日志库 Serilog 使用教程

1. Serilog 简介Serilog 是 .NET 生态中强大且灵活的日志库,支持结构化日志记录,并提供多种日志接收器(Sinks),可以将日志输出到控制台、文件、数据库等不同存储介质。Serilog 适用于控制台应用、ASP.NET Core ..

成功运作一个开源项目的 15 个要点

运作开源项目很容易。所有你需要做的就是让你的源代码可用和开源,对吧?嗯,也许。其实,开源项目是否成功取决于你对项目成功的定义。且不论你是怎么定义的,创建开源项目需要大量的工作。如果你已经有了目标,那么..

.NET C# 单元测试 mock File.Exists的返回值

在 .NET 单元测试中,使用 Moq 来模拟 File.Exists 方法的返回值,可以这样做:1. 使用 Mock<FileSystem>(推荐).NET 提供了 System.IO.Abstractions 库,你可以使用 Mock<IFileSystem> 来替代 File,这样更符合依..

.NET Core 适配 鸿蒙HarmonyOS 的最新进展

.NET Core适配鸿蒙HarmonyOS的最新进展:运行能力方面目前.Net完全具备可以在OpenHarmony系统上运行的能力。其中,NativeAOT方式是较为可行的一种,它编译出的原生so不依赖glibc,可与鸿蒙系统的libc兼容,能在鸿蒙..

VS创建.NET Core项目使用Docker方式部署到Linux服务器

在 Visual Studio(VS) 中,使用 Docker 方式部署 .NET Core 项目 到 Linux 服务器,可以简化环境管理并提高部署效率。以下是完整教程:1. 在 VS 创建 .NET Core 项目并启用 Docker新建 ASP.NET Core 项目打开 Visu..

.NET C#查询全球IP地址信息 IPTools库 使用教程

IPTools 是一个用于快速查询全球 IP 地址信息的库,支持国内和国际 IP 查询,提供详细的地理位置信息(如国家、省份、城市)以及经纬度等数据。IPTools GitHub地址:https://github.com/stulzq/IPToolsIPTools.China..

2025年.NET 10 和 C# 13 新特性示例

.NET 10预计将于2025年11月正式发布,带来一系列性能优化、开发者效率提升和跨平台能力增强。尽管官方功能集仍在开发中,早期预览版与社区讨论已揭示了多项值得期待的改进。这些增强将基于.NET 9的基础,引入新语言..

.NET Core网站减少内存占用的方法

在.NET Core网站开发中,有效管理内存占用对于保证应用程序的性能和稳定性至关重要。以下是一些减少内存占用的关键策略,它们着重于代码优化、内存管理以及相关因素的综合考虑。代码层面的优化首先,编写高效的代码..

.NET平台QR二维码生成库Net.Codecrete.QrCodeGenerator使用教程

今天给大家介绍一个免费的二维码生成库 Net.Codecrete.QrCodeGenerator ,它非常简洁、易用,且可以生成符合二维码标准的二维码图像。Net.Codecrete.QrCodeGenerator是一个开源的二维码生成库,适用于.NET平台。它基..

.NET9 SDK 新版本引入了新的解决方案文件格式.slnx

微软发布了 .NET 9 SDK 的新版本, 在这个新版本中引入了新的解决方案文件格式 slnx 的支持, 现在可以从 dotnet cli 来创建和维护 slnx 了, 并且支持了从 sln 迁移到 slnx, 目前 VisualStudio 和 Rider 都已经支持了 ..

.NET10 C#13最新语法糖用法示例

.NET 10 与 C# 13 带来了更高效的语法和更灵活的类型支持,包括 params 集合扩展、新的 \e 转义序列、方法组的自然类型推断优化,以及 ref struct 允许实现接口等特性,进一步提升了开发体验和代码可读性。C# 13 引..

.NET C# Predicate泛型委托使用方法

Predicate泛型委托:表示定义一组条件并确定指定对象是否符合这些条件的方法。此委托由 Array 和 List 类的几种方法使用,用于在集合中搜索元素。 Predicate<T> 通常用于集合的筛选或搜索操作,比如在 List<T> 的 Fi..

.NET异步编程Task.Run最佳实践

在.NET开发中,Task.Run是一个非常方便的方法,用于将工作移到线程池以异步执行。然而,虽然它看似简单易用,但滥用Task.Run可能会导致一系列性能问题,如线程池耗尽、上下文切换开销过大等。本文将深入探讨Task.Run..

NETworkManager 一个基于.NET的开源网络管理和问题排查工具

NETworkManager 是一个基于.NET开源(GPL-3.0 license)、免费、功能强大的开源工具,旨在帮助用户管理和解决网络问题。通过提供一系列网络连接和管理工具,NETworkManager 能够让用户轻松连接到远程系统,管理网络..

发表回复

返回顶部