学而时习

Upgrade list of Model-2

经过将近一个月的努力,7Timer!的第二期模型在8月31日放出了。测试表明,第二期模型的准确率为78.1%,比第一期模型的66.7%提高了近12个百分点。

以下是第二期模型更新的列表:
1. 减少了低云和高云占的比例,增加了平流层云占的比例,使云量的准确率提高了近12个百分点。
2. 修正了图形文件中云量误判的bug。
3. 修正了0-10之间云量小数位数判断错误的bug。
4. 透明度中,当云量大于30%的时候就不再输出。
5. 减少了雾霾度在透明度中占的比重。
6. 预报图中,将云量变化的命令调整为接近线性,更为美观。
7. 修改了透明度预测中,大于1000就会返回默认值的bug。
8. 修改了风速色块。
9. 取消了smog的输出。
10. 修改了预报图中第一张显示错误日期的bug。
11. 修改了透明度小数位数误判的bug。

After working for nearly a month, the second model of 7Timer! released on August 31. The model perfomence is excellent, the accuracy rise to 78.1%, nearly 12% higher than the previous model.
And this is the upgrade list:
1. Decrease the low and high cloud output and increase the CC cloud output to make the cloud model better, and the accuracy of the cloud forecast rise indeed.
2. Bug fix: The wrong determine of the cloud model.
3. Bug fix: The wrong determine of the "do" position when the cloud is less than 10%.
4. Discard the transparency output if cloud is more than 30%.
5. Discard the smog in transparency forecast, that will made it better.
6. In cloud cover forecast maps, adjust the output to "linear" model.
7. Bug fix: If transparency rate is bigger than 1000, it would not return to -9.99E33.
8. Change the color cent of wind speed.
9. The smog forecast is no longer available. (no use at all with transparecy forecast)
10. Bug fix: Wrong date display in the first map of the forecast maps.
11. Bug fix: Wrong "do" position in transparency when it's less than 10.

7Timer!第二期模型测试发现的bug

昨晚,第二期模型开始内部测试,因此又发现了两个小bug:
1. 对于0-10之间云量的小数位数判断错误。这是两行命令编写不彻底所致,已经解决。
2. 湿度判断中,仍然出现误判"27.3"和"27.3 "的bug,目前尚未解决,但可以在明天之前搞定。
目前看来新模型没有什么大问题,预测也准确,可以在9月1日前启用。根据新旧模型对比,新模型对今天测试地点的预测相当准确,而旧模型就出现了误报。
7Timer!工作组
2005.08.29

7Timer!第二期模型开始内部测试

经过紧张的修正,第二期模型已经开始内部测试,以检验其运作是否正常。
第二期模型选中了第25号候选。整体而言,这一次7Timer!的大规模更新主要有以下几个亮点:
1. 云量模型进行了大规模的测试和修改,其准确率提高了12%。
2. 透明度方面,云量大于30%的时候透明度将显示为白色。另外,减少了雾霾度所占的比重。
3. 风速色块的修改。
4. 命令文件更为稳定,修改了原来出现在云量方面的bug。
5. 修改了透明度大于1000就会返回到默认值的bug。
6. 修改了云量色块的判定方法,改成更为稳定的循环语句判定法,避免出现误差。
如果内部测试没有出现意外,7Timer!将在9月1日前全部换用新模型。
7Timer!工作组
2005.08.28

7Timer!存在一个较严重的bug

工作组今天证实,由于一个误判了“.”的命令可能导致7Timer!预测发生错误。
命令文件目前的指令使得7Timer!认为"27.3"和"27.3 "不同,并将后者归为“overcast”。这个bug使得7Timer!的准确率偏低了0-3.5%。
这个bug已经得到修正,并将随9月1日以前发布的第二期模型一起放出。
7Timer!工作组
2005.08.27

7Timer!研究进展

Model-2已经正式确定。经过发布57个Release Candidates版本之后,M2RC25模型入选,成为第二期模型所用的版本。
虽然M2RC25的准确率不是最高的,但它和最高的准确率差异只有0.1%,不足以考虑。以下是试验数据,结果来自于20个站点120小时的对比分析:

M2RC25 OVERALL
准确率 72.2593985
平均偏差 -0.277819549
标准差 3.32416408
新准确率 78.02255639
黑白准确率 71.80451128

其准确率为78%+/-7.5%,允许误差为+/-3小时,黑白准确率的误差为+/-30%和+/-3小时。
第二期模型不会在今明两日发布,但九月份之前所有的7Timer!都会换用第二期模型。
下一步工作组将尝试提高透明度的准确率,这个工作量要比云量预测小一些。此外,透明度预测中的小bug也将得到修正。
7Timer!工作组
2005.08.25

7Timer!研究进展

经过反复对比,发现GJ3系列的主要差距竟然是出在那个引入的三角系数上!唉,真是犯了老爱的宇宙常数的错误啊。在把三角系数去掉之后,GJ-3和GJ-5已经大体相近,这两个昔日对手终于握手言和。我就这样综合了GJ-3和GJ-5的长处,正式开始Model-2的测试。

今天测试了近90个参数组合,发布8个RC版,其中最后发布的(要睡觉了,明天再弄)M2RC8效果最为杰出,测试结果如下:

M2RC8 OVERALL
准确率 72.06015038
平均偏差 -0.154135338
标准差 3.363165995
新准确率 77.7556391
黑白准确率 71.80451128

黑白准确率是我新引入的测量准确度的量。其测量方法:如果实际云量在预测云量的+/-30%范围内,就算预报准确,否则算误报。由于预报准确与否黑白分明,所以叫黑白准确率。经过一番努力,黑白准确率由GJ-3K的59%提高到现在的72%,让人比较满意了。
虽然准确率目前达77.8%,已经达到可发布标准,但我仍将找到最好的参数以后再发布之,这一天不远了,请诸位关注!
7Timer!工作组
2005.08.24

7Timer!研发新闻

今晚对两个模型都进行了轻度修正,将M-1B命名为GJ-5系列,结果好了一些了。结果如下:

平均偏差 第一期 GJ3J
北京 -0.552631579 -0.684210526
广州 0.473684211 0.421052632
哈尔滨 0.631578947 0.342105263
拉萨 1.078947368 0.736842105
乌鲁木齐 0.552631579 0.289473684
南京 2.763157895 2.684210526
海口 -1.315789474 -1.605263158
平均 0.518796992 0.312030075

标准差 第一期 GJ3J
北京 4.705525131 4.867211799
广州 2.872160768 2.796911633
哈尔滨 4.239048134 4.112089466
拉萨 2.399359333 2.711420394
乌鲁木齐 2.988551563 2.85535411
南京 3.157565772 3.442040881
海口 4.472755322 4.67659049
平均 3.547852289 3.63737411

新准确率 第一期 GJ3J
北京 73.55263158 72.23684211
广州 83.68421053 85.52631579
哈尔滨 69.21052632 71.31578947
拉萨 82.76315789 80.65789474
乌鲁木齐 82.23684211 83.55263158
南京 75.78947368 74.86842105
海口 65.26315789 63.02631579
平均 76.07142857 75.88345865

适当降低高云比例之后,GJ-3K展现出了比较大的潜力,把和GJ-5C的差距又缩小了。同时两个模型的准确率都提高了。
如果GJ-3系列的标准差能再降低到GJ-5的水平,其准确率可达77%。即使达不到,这两个模型都已经达到了可发布的标准了。
7Timer!工作组
2005.08.22

7Timer!研发新闻

考虑了时间预测差异后,我重新计算了所有模型的准确度。

时间预测差异的计算方法如下:计算两个值,一个是预测和实际的差,另一个是预测的和6小时内实际量平均值的差。这两个数值内取较小的一个作为计算量值,这样就考虑到了天气系统过境时的预测差量(即设定预测误差为+/-3小时,和时间预测精度刚好相符)。于是得到以下结果:

新准确率 GFS 第一期 GJ3J GJ4B
北京 74.60526316 74.34210526 72.5 73.28947368
广州 72.89473684 83.94736842 85.26315789 83.55263158
哈尔滨 64.07894737 68.81578947 70.26315789 66.31578947
拉萨 73.02631579 82.76315789 79.73684211 80.39473684
乌鲁木齐 82.76315789 82.23684211 83.55263158 81.97368421
南京 67.23684211 75 74.07894737 69.34210526
海口 63.94736842 65 62.5 65.52631579
平均 71.22180451 76.01503759 75.41353383 74.34210526

GFS数据模型的准确率虽然达到71.2%,但因为算上了预测时间差以后,其准确率不如M-1B和GJ-3J,因此被这两个模型拉开了0.05%。
M-1B以76.0%的优势领先,同样的,GJ-3J以75.4%的准确率紧随其后,这两者的差距仍然没有改变。GJ-4B则被拉下,它被M-1B和GJ-3J拉开了0.09%,可以说GFS和GJ-4系列的命运已经走到了尽头。接下来Model-2花落谁家,将在M-1B和GJ-3系列中展开激烈的竞争。
7Timer!工作组
2005.08.22

7Timer!研发新闻

今天修改了现有的几个模型,并初步确定之后,进行了多站测试。先介绍一下进行第一轮总体测试所用的模型:

1.GFS自带模型,不用介绍了,就是数据中自带的云量输出。
2.Model-1B,就是现在7Timer!所用模型的改进版,去掉了Model-1A云量常数。
3.改进-3J。改进-3模型的最新版,对低、中云进行了修正,并增大了高云三角函数的修正量。
4.改进-4B。在Model-1B的基础上引入了高云三角函数修正,同时对低、中云进行了少量修正。

下面是测试结果:

准确率 GFS 第一期 GJ3J GJ4B
北京 66.31578947 66.84210526 64.73684211 65.52631579
广州 65 75.26315789 77.63157895 75.78947368
哈尔滨 60.52631579 65.26315789 65.52631579 61.57894737
拉萨 68.94736842 78.68421053 76.05263158 76.31578947
乌鲁木齐 80 79.73684211 80.78947368 79.21052632
南京 61.31578947 68.94736842 68.15789474 64.47368421
海口 60.52631579 61.05263158 58.68421053 61.84210526
平均 66.09022556 70.82706767 70.22556391 69.2481203

平均偏差 GFS 第一期 GJ3J GJ4B
北京 0.263157895 -0.421052632 -0.578947368 -0.447368421
广州 2.921052632 0.526315789 0.447368421 0.210526316
哈尔滨 1.631578947 0.789473684 0.447368421 0.105263158
拉萨 2.526315789 1.131578947 1.026315789 1.421052632
乌鲁木齐 0.526315789 0.605263158 0.342105263 0.552631579
南京 3.710526316 2.842105263 2.763157895 2.131578947
海口 0 -1.157894737 -1.605263158 -1.342105263
平均 1.654135338 0.616541353 0.406015038 0.37593985

标准差 GFS 第一期 GJ3J GJ4B
北京 4.940084223 4.67710875 4.886240504 4.83244173
广州 3.165451485 2.908579343 2.834908041 2.966105853
哈尔滨 4.664654625 4.237414149 4.277833739 4.661090191
拉萨 2.582704031 2.374990888 2.804947153 2.55086754
乌鲁木齐 3.015196966 3.004728499 2.895334866 3.023568547
南京 3.641196266 3.240584059 3.459800804 4.085732896
海口 4.909711107 4.574105123 4.710232275 4.467875486
平均 3.845571243 3.573930116 3.695613912 3.79824032

从结果可以看出:M-1B以70.8%的准确率排名第一,而GJ-3J以70.2%的准确率紧随其后。GJ-4B差距较大,为69.2%,而自带模型效果最差,仅为66.1%。平均偏差表示了预测量平均距离实际量的范围。误差最大的还是自带模型,偏高16.5%,而GJ-4B和GJ-3J分别为+3.8%和+4.1%,比M-1B的+6.2%小一些。
标准差方面,自带模型再次给出最差表现,达3.85。M-1B表现较好,仅为3.57,而GJ-3J和GJ-4B分别为3.70和3.80。
改进计划:经过第一轮测试,自带模型已经被否决,而GJ-4系列也没有很好的上升空间。M-1B虽然微弱领先GJ-3J,但其平均偏差要比GJ-3J高1.5倍。因此,如果GJ-3J的标准差能降到M-1B的水平,其准确率肯定还有较大范围的提升。模拟表明,如果GJ3J的标准差降到M-1B的水平,其准确率可达71.8%。
此外,准确率的计算还有待商榷。因为预报精度的原因(1 arc deg),天气特征过境的时候会有轻微的时间差异,这一点也必须考虑在内。
7Timer!工作组
2005.08.21

7Timer!研发新闻

今晚构造了一个新的模型,称为GJ-2和GJ-3。到现在,各个模型的测试结果如下。从左到右:GFS自带,第一期模型(目前使用的模型),GJ-1,GJ-2,GJ-2B,GJ-3A。

准确率 65 75.26315789 71.84210526 74.21052632 75.26315789 76.84210526
平均偏差 2.921052632 0.526315789 1.394736842 1.052631579 0.789473684 -0.421052632
标准差 3.165451485 2.908579343 3.273011439 2.937483424 2.948308121 2.824997242

GJ-3A是在GJ-2B的基础上综合了GJ-1的优点编写的,显然看出它比GJ-1和GJ-2系列模型都要好,是唯一一个可以比第一期模型优秀的候选模型。经过全球测试表明,GJ-3A比第一期模型表现要好。
GJ-3A在云量叠加方面进行了修改,主要是引进了一个三角函数,以便尽可能的使High Cloud Cover的输出符合现实情况。目前GJ-3系列模型还有2个参数(命名为a、b)等待最终确定。
7Timer!工作组
2005.08.19