正文:【摘要】本次建模解决的问题是:双色球摇奖号码的规律性,投注技巧的可信性及销售额与中奖注数的预测。通过收集并观察2010年共153期的中奖数据,我们对可能影响中奖注数的因素进行了猜测、分析和试验,最终发现中奖注数和总销售额之间的关系较为明显,故决定使用EXCEL软件对过去的中奖注数和总销售额进行拟合,即可对未来的中奖情况和销售额进行预测,以此作为模型的雏形。之后,通过对彩票市场的深入了解及分析,找到了可能影响彩票销售额的因素,并使其在改进后的模型中得到体现,随后使用SAS软件对预测结果进行检验分析,判断新模型是否更可靠,借此逐步筛选有效因素,得出最终优化模型。
【关键词】双色球 建模 中奖注数 中奖概率
一、问题重述
本次建模解决的问题是:双色球摇奖号码的规律性,投注技巧的可信性及销售额与中奖注数的预测。从数字1-33中随机无序地取出6个数字:x1,x2,x3,x4,x5,x6.再从数字1-16中随机取出1个数字x7,共7个数字组成一组中奖数据X。根据彩民手中买的数组与中奖数组之间的差异不同,分为一至六等奖。我们的问题首先就是寻找各等奖在理论上的中奖概率,并和实际中奖情况进行对比分析。第二利用历年销售额进行回归拟合,从而得出销售额的变化规律,从而对未来进行有效预测。第三,对网上各种投注技巧进行检验,揭露所谓技巧之后的真相。
二、假设
- 网上所有关于双色球历年的所有数据均真实可信。
- 摇奖过程不掺杂人为因素,无弄虚作假。
- 某一年销售额受到过去若干年销售额的影响,且相隔越久,影响越弱。
- 每种号码出来的概率都是一样的,所有球除了标的数字不一样,其他属性包括大小、质量等都是相同的。
三、建模
直接对一、二等奖中奖注数进行拟合,发现散点图分布较散,R平方的值很小。(图1)

图1
于是进行一元多次拟合,发现其效果有改善。(图2)

图2
我们知道,销售额的期望与平均中奖注数有较强正比性,所以通过对销售额比较准确的预测,进而求出中奖注数,比直接拟合中奖注数求近似解来预测也许显得更可靠。
设销售额为s,总下注数为n=s/2,一、二等奖中奖概率p1、p2为常数,一、二等奖中奖注数分别为p1*n,p2*n。使用SAS软件对其做正态性检验,发现P值很小,不符合正态性,原因估计是由于p1、p2太小,样本数量不够多。
通过统计软件计算得出,销售总额的平均值为254118971,标准误差为2115778.96,p1*n=7.17,p2*n=107.55,一等奖平均中奖注数为8.11,标准误差为0.75,二等奖平均中奖注数为114.88,标准平均误差为8.91。
可见,通过对销售额进行预测,从而求出一、二等奖中奖注数是比较可行的。
我们假设时间是从1时刻到T时刻,使用EXCEL软件对销售额进行一元线性拟合,发现R平方值为0.4214,相关性较小,拟合结果比较差。(图3)

图3
对此我们进一步做一元六次拟合,此时R平方值为0.6634,相关性有显著提高。(图4)

图4
函数与实际情况较为接近,但仅仅限定在这153期的范围内。而当t>153之后,销售额不断下降,且下降趋势愈来愈大,完全不符合实际情况。为了模型的准确性,我们用2009年的销售额数据,对其进行观察分析。(图5)

图5
通过比较,发现2009年的销售额与2010年的销售额有基本相同的走势,我们推测出销售额具有周期性变化的性质,且周期为一年。因此,可用2010年销售额随时间变化的函数来预测2011年1月和2月的销售额。函数初始值即为2010年末的销售额。
四、求解和分析
1、一等奖:1种可能性,概率为1/17721088
二等奖:15种可能性,概率为15/17721088
三等奖:162种可能性,概率为162/17721088
四等奖:7695种可能性,概率为7695/17721088
五等奖:137475种可能性,概率为137475/17721088
六等奖:1043640种可能性,概率为1043640/17721088
总中奖概率约为1/16。通过概率计算可知,事实上,根本不存在所谓的冷号、温号和热号之分,因为人们的投注是不会影响机器的摇号过程的,每个数字出现的概率都是独立且相等的。而对于“兼顾两头”的说法,“两头”的数一共有9个数,占了3/11,由于每个数字之间的等概率性,也完全没有必要一定要在“两头”中选2-3个数。最后,对于连号的概率分析,不通过计算也可以很明显的知道,“二连”的概率远大于“三连”,但这只是意味着所有带“二连”的投注比所有带“三连”的投注更容易中奖,而在某一次投注中,“二连”和“三连”的一等奖中奖概率是一模一样的,都是1/17,721,088。
- 对于这两组号码,我们的第一反应是前一组更可信,因为“二连”的概率远大于“三连”的概率。但是通过理论计算和分析,得到的结论是应该对这两组号码持相同态度。原因是,这是一组过去的中奖号码,即它是给定的一个数组,是所有情况中的一种,那么,这组号码是05、07、18、19、25、31这一组的概率,和是05、17、18、19、25、31这一组的概率是相同的。故我不会更加去相信其中的任何某一组。
- 而若这是将来的某一期,则该期的中奖号码也将会是所有情况中的任意一种。05、07、18、19、25、31与05、17、18、19、25、31这两组号码分别是其中的两个个体,所占的份额是一样的。
事实上,任意两组号码的中奖概率都是一样的,与网上流传的“二连”“奇偶比”等选号准则皆无关。
2、
期数 |
C1实际值 |
C1预测值 |
C1差值 |
1 |
9 |
8.1 |
-0.9 |
2 |
7 |
8.08 |
1.08 |
3 |
14 |
8.07 |
-5.93 |
4 |
2 |
8.04 |
6.04 |
5 |
1 |
8.02 |
7.02 |
6 |
2 |
8 |
6 |
7 |
6 |
7.98 |
1.98 |
8 |
3 |
7.95 |
4.95 |
9 |
3 |
7.93 |
4.93 |
10 |
9 |
7.91 |
-1.09 |
11 |
10 |
7.89 |
-2.11 |
12 |
4 |
7.86 |
3.86 |
13 |
8 |
7.84 |
-0.16 |
14 |
7 |
7.82 |
0.82 |
15 |
9 |
7.8 |
-1.2 |
16 |
5 |
7.78 |
2.78 |
17 |
2 |
7.76 |
5.76 |
18 |
7 |
7.75 |
0.75 |
19 |
3 |
7.73 |
4.73 |
20 |
5 |
7.72 |
2.72 |
21 |
9 |
7.71 |
-1.29 |
22 |
9 |
7.7 |
-1.3 |
平均数 |
6.09 |
7.88 |
1.79 |
|
|
|
|
期数 |
C2实际值 |
C2预测值 |
C2差值 |
1 |
76 |
121.54 |
45.54 |
2 |
102 |
121.27 |
19.27 |
3 |
50 |
120.98 |
70.98 |
4 |
119 |
120.67 |
1.67 |
5 |
109 |
120.34 |
11.34 |
6 |
95 |
120.01 |
25.01 |
7 |
96 |
119.66 |
23.66 |
8 |
50 |
119.31 |
69.31 |
9 |
90 |
118.96 |
28.96 |
10 |
118 |
118.62 |
0.62 |
11 |
73 |
118.28 |
45.28 |
12 |
124 |
117.94 |
-6.06 |
13 |
41 |
117.62 |
76.62 |
14 |
156 |
117.31 |
-38.69 |
15 |
110 |
117.01 |
7.01 |
16 |
107 |
116.73 |
9.73 |
17 |
141 |
116.47 |
-24.53 |
18 |
98 |
116.22 |
18.22 |
19 |
51 |
116 |
65 |
20 |
51 |
115.79 |
64.79 |
21 |
226 |
115.6 |
-110.4 |
22 |
51 |
115.43 |
64.43 |
平均数 |
97.00 |
118.26 |
21.26 |
1/5 1 2 3 4 5 下一页 尾页