查询语言定义
查询语言包括数据库查询语言 (database query language - DQL),是一种用于查询和从数据库检索信息的专用计算机语言。它充当用户和数据库之间的接口,使用户能够管理来自数据库管理系统 (database management system - DBMS) 的数据。
最广泛使用的现代查询语言之一是结构化查询语言 (Structured Query Language - SQL),这是一种领域特定的编程语言,用于与关系数据库交互并对其中的结构化数据执行操作。结构化查询语言使用 “FIND”、“INSERT”、“DELETE”、“ORDER BY”、“SUM” 和 “SELECT” 等命令,这些命令可以形成语法语句,用于定义和更改数据库架构、搜索、填充和更新数据库内容以及定义从触发器和完整性约束到存储过程和授权规则的所有内容。
在日益数据驱动的世界中,SQL 等查询语言和其他强大的变体是各级数据和计算机专业人员的基础工具。
那么,什么是查询?
从最广泛的意义上讲,查询是指从数据库或数据存储库系统请求数据或信息。此请求通常以特定问题或命令的形式提出,用数据库可以理解的查询语言编写。
查询可以像从特定表中获取特定数据子集一样简单,也可以像执行复杂的计算和数据转换一样复杂。查询可用于查找、汇总、过滤、组合、调整、删除、插入和更新数据。它们还可以回答与数据相关的问题,一次分析来自多个表的数据,并自动执行数据管理任务。
一些基本类型的查询包括选择查询(select queries)、参数查询(parameter queries)、生成表查询(make-table queries)、附加查询(append queries)和交叉表查询(crosstab queries),但使用查询语言启用的结构化命令,查询也可以成倍地复杂化。
查询语言的类型
SQL 是迄今为止最流行和最常用的关系数据库查询语言。它被称为声明性语言(declarative language),这意味着它描述需要完成什么而不是如何完成,但它也包括传统的程序元素。
虽然有许多 DQL 和 SQL 变体,并且术语可能重叠,但 SQL 子语言通常分为五大类:
- 数据查询语言 (Data Query Language - DQL)
- 数据定义语言 (Data Definition Language - DDL)
- 数据控制语言 (Data Control Language - DCL)
- 数据操作语言 (Data Manipulation Language - DML)
- 事务控制语言 (Transaction Control Language - TCL)
此外,还有用于非关系数据库的语言,称为 NoSQL,即 “非 SQL” 数据库。与使用表和结构化数据的关系数据库不同,NoSQL 数据库使用键值、图形、宽列(wide columns)和文档等方法来存储和检索数据。虽然 SQL 适用于包含结构化数据并使用预定义架构的关系数据库,但 NoSQL 擅长使用动态架构(dynamic schemas)来处理非结构化数据和大数据。
以下是一些数据库查询语言的示例,这些语言通常针对特定领域和用例开发,包括:
- DMX - 用于数据挖掘模型
- MongoDB - 使用基于方法的查询格式来查询 MongoDB 中的数据
- GraphQL - 用于 API
- Tutorial D - 用于真正的关系数据库管理系统 (TRDMS)
- XQuery - 用于 XML 数据源
- Neo4j 的 Cypher - 用于图形
- CodeQL - 用于自动安全检查和变体分析
- MDX - 用于 OLAP 数据库
- Elasticsearch query DSL 用于访问 Elasticsearch 中的数据
查询语言的应用
随着数据在商业和日常生活的几乎每个角落激增,查询语言正以前所未有的规模部署。跨领域和企业的应用深度和广度仅受全球数据库采用和容量规模的限制。
从数据库管理到更具体的应用场景,如商业智能和软件开发,查询语言在推动数据驱动决策中发挥着重要作用。通过数据挖掘和分析,查询语言能够帮助从客服人员到首席执行官识别模式和趋势,从而获得宝贵的洞察力。
无论是大型数据驱动型公司,还是最小的电商商家,利用用户信息并基于此采取行动的能力,如今已成为许多商业模式的核心支柱。
对于依赖数据的大型公司,甚至是最小的电子商务商家,利用用户信息并采取行动的能力现在已成为许多商业模式的核心支柱。
仅举几个跨行业的实际应用:
- 在医疗保健领域,DQL 可用于分析有关患者行为和医疗状况的大量信息数据集。
- 从银行到支付处理商的金融机构使用数据查询语言来做从检测欺诈到提供个性化客户体验的所有事情。
- 社交媒体平台使用 DQL 来存储、排序和更新有关用户个人资料、浏览量、购买历史、新帖子、喜欢和分享等的信息。
- 营销人员使用 DQL 和 SQL 来识别目标受众、跟踪跨渠道的销售归因和活动绩效,并分析消费者行为模式。
- 数据库管理员使用 DQL 来更新、维护和保护他们的环境,确保有关用户、员工、学生或患者的机密信息安全。
- 商业和研究领域的数据分析师和数据科学家使用 DQL 来简化对海量数据集进行排序以发现趋势和见解的过程。
查询语言与编程语言
查询语言和编程语言有一些相似之处,但它们的用途不同,并且在不同的环境中运行。
目的
- 查询语言的主要目的是与数据库交互或 “对话” 并检索特定数据。然而,编程语言用于开发软件应用程序、定义算法和操作数据结构。
语法
- 查询语言(如 SQL)具有一组预定义的关键字和严格的语法,专门用于查询数据库,专注于数据提取和操作。编程语言具有更通用的语法,允许更广泛的功能和能力。
用例
- 查询语言主要用于对数据库执行操作。编程语言适用于更广泛的应用程序,包括开发软件、Web 应用程序和系统软件。
虽然 SQL 本身在技术上符合编程语言的条件,但它是一种专门为与数据库一起工作而构建的领域特定语言。与 SQL 不同,你可以使用通用语言 (General Purpose Languages - GPLs) 来构建整个应用程序和程序,并具有你需要的任何类型的逻辑。
流行的 GPL 包括 Python、C++、Ruby、Java 和 JavaScript,你可以使用它们来编写桌面、移动或 Web 应用程序。
如何提高查询语言技能
虽然 SQL 是最常见的查询语言,但选择一种符合数据目标的语言也很重要。例如,不同类型的数据适合不同的语言 —— 例如,Cypher 或 Gremlin 适用于图形数据库,SPARQL 适用于 RDF 数据。
提高 QL 技能的最佳方法是定期检查和优化现有查询以提高其效率和性能。利用索引、避免不必要的连接并简化代码,以确保查询即使在处理大型数据集时也能顺利、快速地运行。
不要拘泥于简单的 “SELECT” 语句,而是通过使用涉及连接(joins)、左连接(left joins)、子查询(subqueries)和聚合(aggregate)函数的更复杂的查询来挑战自己。如果你不经常使用数据查询语言,请通过解决需要你同时从多个表中检索特定数据的实际场景来练习。
以下是一些帮助你优化查询语言的提示:
- 选择正确的连接(join)类型可以极大地影响查询性能,使你能够有效地组合来自多个表的数据。
- 索引是优化 SQL 查询的绝佳工具,它允许数据库引擎根据特定列快速定位和检索数据。
- 数据库表的结构至关重要。减少需要处理的数据量以加快查询速度。
- 子查询允许你将一个查询嵌套在另一个查询中以检索更具体的数据。
- 使用 LIMIT 和 OFFSET 关键字从查询中检索特定数量的行,从特定偏移量开始。
- 掌握在 SQL 中实现存储过程和函数的技巧。通过将常用查询存储为可重用过程,自动执行重复任务和复杂操作。查询缓存允许数据库引擎将经常使用的查询的结果存储在内存中。
- 努力学习高级或不熟悉的 SQL 概念,如窗口函数、递归查询和通用表表达式 (common table expressions - CTEs)。了解这些高级功能可以提高你操作和分析复杂数据集的能力,并提高你的整体熟练程度。
我们之前讨论过许多可用的查询语言;每种语言都具有独特的优势,可以高效、轻松地简化和加快你的目标。
体验 Elasticsearch 查询语言 (ES|QL)
Elasticsearch 查询语言 (ES|QL) 是一种新的管道语言,可以转换、丰富和简化数据调查。ES|QL 由新的查询引擎提供支持,可提供高级搜索功能和并发处理,无论数据源和结构如何,都可以提高速度和效率。ES|QL 可用于快速搜索和聚合数据,以轻松找到你要查找的内容。
ES|QL 不仅仅是一种语言。它标志着安全性和可观察性方面数据调查方法的重大转变。ES|QL 搜索、聚合和转换功能不是将查询表达式转换为查询 DSL 来执行,而是直接在 Elasticsearch 本身中执行。提供迭代语言使分析师能够轻松提出问题,从而大大简化调查。
更多阅读:
-
Elasticsearch:ES|QL 查询语言简介
-
Elasticsearch:ES|QL 查询展示
-
Elasticsearch:ES|QL 动手实践
查询语言常见问题解答
Elasticsearch 的查询语言是什么?
Elasticsearch 支持多种查询语言,从 Query DSL 和 EQL 到 KQL、SQL、Painless 和Canvas/Timelion。但我们最近推出的强大的 Elasticsearch 查询语言 (ES|QL) 代表了一次巨大的飞跃。
Elasticsearch 可以用作 SQL 吗?
是的。Elasticsearch 具有满足你数据需求的速度、规模和灵活性 — 而且它使用 SQL。使用传统数据库语法来解锁非传统性能,例如对 PB 级数据进行全文搜索并获得实时结果。使用 Elasticsearch SQL,你可以获得相关性评分、词干提取、同义词、水平可扩展性和极快的速度。
查询语言资源
- 从梦想到现实:宣布 Elastic 的管道查询语言 ES|QL
- ES|QL 文档
- 演示 ES|QL
- 介绍事件查询语言
- ES|QL 管道参考
你接下来应该做什么
只要你准备好……我们可以通过以下 4 种方式帮助你将数据引入你的业务:
- 开始免费试用,了解 Elastic 如何帮助你的业务。
- 浏览我们的解决方案,了解 Elasticsearch 平台的工作原理以及我们的解决方案如何满足你的需求。
- 通过我们的 45 分钟网络研讨会了解如何设置你的 Elasticsearch 集群并开始数据收集和提取。
- 与你认识的喜欢阅读这篇文章的人分享这篇文章。通过电子邮件等方式与他们分享。