且构网

分享程序员开发的那些事...
且构网 - 分享程序员编程开发的那些事

关于SQLServer2005的学习笔记——CTE递归和模拟测试数据

更新时间:2022-09-18 11:59:10

在 Oracle 中模拟测试 数据是非常简单的一件事情。
Oracle 首先提供了一个 dual 的虚表
其次提供了一个 Connect by 语句,实现了虚表数据列的模拟
最后 Oracle 提供了强大的 DBMS_RANDOM 包进行相关随机数的产生。
SELECT
  TRUNC(DBMS_RANDOM.VALUE(1,101)),
  DBMS_RANDOM.string('~',5),
  DBMS_RANDOM.string('l',5),
  DBMS_RANDOM.string('L',5),
  DBMS_RANDOM.string('a',5),
  DBMS_RANDOM.string('A',5),
  DBMS_RANDOM.string('u',5),
  DBMS_RANDOM.string('U',5),
  DBMS_RANDOM.string('x',5),
  DBMS_RANDOM.string('X',5),
  DBMS_RANDOM.string('p',5),
  DBMS_RANDOM.string('P',5)  
from
(
SELECT level,ROWNUM rn
  FROM DUAL
CONNECT BY ROWNUM<=1001

 
 
相比而言, SQLServer 则没那么幸运了,首先没有虚拟的概念,则需要构建一个物理表以存储需要模拟的次数,再次需要使用 CTE 递归来模拟一个虚表数据,最后才通过相关随机函数进行构建数据。
-- 创建一个物理表,并插入要模拟的次数,最大不能超过 32767
CREATE TABLE RandTable
(
  MaxNumber INT CHECK (MaxNumber >= 0 AND MaxNumber<=32767),
)
INSERT INTO RandTable values(32767); 
 
-- 使用 CTE 递归构建列数据
WITH AutoSequence(MaxNumber,Identiy)
AS
(
SELECT e.MaxNumber,1 AS Identiy FROM RandTable AS e
UNION ALL
SELECT e.MaxNumber,Identiy+1 c FROM RandTable AS e,AutoSequence d
WHERE d.Identiy<e.MaxNumber AND d.Identiy<500

 
-- 用时间 + 递增值做种子进行 RAND
SELECT LEFT(NEWID(),4),
       RAND((DATEPART(mm,GETDATE())*100000)+(DATEPART(ss,GETDATE())*1000)+DATEPART(ms,GETDATE())),
       RAND(Identiy+(DATEPART(mm,GETDATE())*100000)+(DATEPART(ss,GETDATE())*1000)+DATEPART(ms,GETDATE())),
       CAST(RIGHT(CAST(RAND(Identiy+CAST(GETDATE() AS INT)) AS VARCHAR(100)),2) AS INT),
       CAST(RIGHT(CAST(RAND(Identiy+(DATEPART(mm,GETDATE())*100000)+(DATEPART(ss,GETDATE())*1000)+DATEPART(ms,GETDATE())) AS VARCHAR(100)),2) AS INT)
  FROM AutoSequence
OPTION (MAXRECURSION 32767);
SELECT LEFT(NEWID(),4),
       CAST(RIGHT(CAST(RAND(Identiy+CAST(GETDATE() AS INT)) AS VARCHAR(100)),2) AS INT)
  FROM AutoSequence
OPTION (MAXRECURSION 32767);
  
 
小结:
使用 CTE 递归和 SQLServer 随机函数还是存在很多问题的。
1 、一定需要构建一种物理表
2 、 CTE 递归限制在 0 到 32,767 之间
3 、 RAND 产生的随机数比较集中,通过时间 + 递增值的方式来实现的话,只能截取后几位,导致无法控制随机值的区域。
4 、 NEWID() 产生的随机数为字符和数字混杂,也不能得到预期的效果
 
附,经测试不需要物理表也可
WITH RandTable(MaxNumber)
AS
(
SELECT 500 MaxNumber
),
AutoSequence(MaxNumber,Identiy)
AS
(
SELECT e.MaxNumber,1 AS Identiy FROM  RandTable AS e
UNION ALL
SELECT e.MaxNumber,Identiy+1 c FROM  RandTable AS e,AutoSequence d
WHERE d.Identiy<e.MaxNumber AND  d.Identiy<500
)
SELECT LEFT(NEWID(),4),
RAND((DATEPART(mm,GETDATE())*100000)+(DATEPART(ss,GETDATE())*1000)+DATEPART(ms,GETDATE())),
RAND(Identiy+(DATEPART(mm,GETDATE())*100000)+(DATEPART(ss,GETDATE())*1000)+DATEPART(ms,GETDATE())),
CAST(RIGHT(CAST(RAND(Identiy+CAST(GETDATE() AS INT)) AS  VARCHAR(100)),2) AS INT),
CAST(RIGHT(CAST(RAND(Identiy+(DATEPART(mm,GETDATE())*100000)+(DATEPART(ss,GETDATE())*1000)+DATEPART(ms,GETDATE()))  AS VARCHAR(100)),2) AS INT)
FROM AutoSequence
OPTION (MAXRECURSION 32767);
 



本文转自baoqiangwang51CTO博客,原文链接:http://blog.51cto.com/baoqiangwang/310457,如需转载请自行联系原作者