加入收藏 | 设为首页 | 会员中心 | 我要投稿 汽车网 (https://www.0577qiche.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 站长学院 > MsSql教程 > 正文

SQL Server联合运算符的使用

发布时间:2023-06-08 10:48:16 所属栏目:MsSql教程 来源:
导读:今天这篇我们来学习和了解“SQL Server联合运算符的使用和优化技巧是什么”,下文的讲解详细,步骤过程清晰,对大家进一步学习和理解“SQL Server联合运算符的使用和优化技巧是什么”有一定的帮
今天这篇我们来学习和了解“SQL Server联合运算符的使用和优化技巧是什么”,下文的讲解详细,步骤过程清晰,对大家进一步学习和理解“SQL Server联合运算符的使用和优化技巧是什么”有一定的帮助。有这方面学习需要的朋友就继续往下看吧!

联合运算符

所谓的联合运算符,其实应用最多的就是两种:UNION ALL和UNION。

这两个运算符用法很简单,前者是将两个数据集结果合并,后者则是合并后进行去重操作,如果有过T-SQL语句的码农都不会陌生。

我们来分析下这两个运算符在执行计划中的显示,举个例子

SELECT FirstName+N''+LastName,City,Country FROM Employees
UNION ALL
SELECT ContactName,City,Country FROM Customers

这个联合运算符合很简单的操作,将两个数据集合扫描完,通过联合将结果汇总。

我们来看一下UNION 这个运算符,例子如下

select City,Country from Employees

UNION

SELECT City,Country FROM Customers

我们可以看到,UNION 运算符是在串联运算符之后发生了一个Distinct Sort排序操作,经过这个操作会将结果集合中的重复值去掉。

我们一直强调:大数据的排序是一个非常耗资源的动作!

所以,到这里我们已经找到了可优化的选项,去掉排序,或者更改排序方式。

替换掉Distinct Sort排序操作的方式就是哈序聚合。Distinct Sort排序操作需要的内存和去除重复之前数据集合的数据量成正比,而哈希聚合需要的内存则是和去除重复之后的结果成正比!

所以如果数据行中重复值很多,那么相比而言通过哈希聚合所消耗的内存会更少。

我们来举个例子

select ShipCountry from Orders

UNION

SELECT ShipCountry FROM Orders

这个例子其实没啥用处,这里就是为了演示,我们来看一下结果

我们知道,这张表里这个ShipCountry是存在大面积重复的,所以采用哈希匹配来去重操作是最优的方式。

其实,相比哈希匹配连接还有一种更轻量级的举重的连接方式:合并连接

我们知道优化的方式可以采用建立索引来提高排序速度。

我们来重现这种去重方式,我们新建一个表,然后建立索引,代码如下

--新建表
SELECT EmployeeID,FirstName+N' '+LastName AS ContactName,City,Country
INTO NewEmployees
FROM Employees
GO

--添加索引
ALTER TABLE NewEmployees ADD CONSTRAINT PK_NewEmployees PRIMARY KEY(EmployeeID)
CREATE INDEX ContactName ON NewEmployees(ContactName)
CREATE INDEX ContactName ON CUSTOMERS(ContactName)
GO

--新建查询,这里一定要加上一个显示的Order by才能出现合并连接去重
SELECT ContactName FROM NewEmployees

UNION ALL

SELECT ContactName FROM Customers
ORDER BY ContactName

我们采用索引扫描的方式可以避免显式的排序操作。

我们将UNION ALL改成UNION,该操作将会对两个数据集进行去重操作。

关于“SQL Server联合运算符的使用和优化技巧是什么”就介绍到这了,如果大家觉得不错可以参考了解看看,如果想要了解更多,小编每天都会为大家更新不同的知识。

(编辑:汽车网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章