Some Photos

Google Flu Trend 谷歌发布流感趋势实验站点

Google发布了墨西哥的猪流感趋势警报:
http://www.google.org/flutrends/intl/en_mx/index.html
在这个站点上同时还透露了这个实验的细节, 工作原理, 甚至还有原始数据. 先挖个坑, 有空稍微看看.

Data Warehousing Maturity

TDWI 's latest publication "Gauge Your Data Warehousing Maturity" presents six stage model for a typical BI system life cycle. It provides sort of guidance on where you are and where you should go in the process of BI/DW.

Sadly, I have found out the place I work is still sitting somewhere between prenatal and child stage--formatting reports and struggling with all kinds of spreadsheets. Users are not statisfied with what and how they get the data (althoug they are pretty satisfied with their own spreadsheets). One hand, information is bits here and bits there. On the other, it is not possible to "search" for the information as needed. Yet I find it very hard to push forward to the next stage as there seems to be little awareness that data is valuable asset in such an environment that real production only is treated as valuable.

The article clearly predicts in the end that at final stage of BI system, the system itself should become unnoticed. It is bit of ideal but I believed years ago that IT should not exist as its final form of existence.

译言的译文连接在这里!

Ken Rockwell: How to afford anything

How to afford anything

From Ken Rockwell, the free lance photographer and blogger, advices and tips on how to be able to afford things like luxury SLRs and Lens.

This piece is pretty long actually, but I would assure you that the time is worth its while. It is not that I agree with everything he writes. I hope everyone finds his own candy in the jar.
How to afford anything
Ken Rockwell是一个自由摄影师和博客写手, 主要靠摄影作品和他的博客(有一些购买摄影器材的推荐链接)为生. 这篇文章是他写的他如何能够买得起很多巨贵的器材--作为一个自由职业者. 很长, 而且是全英文的, 不过我强烈推荐大家读一下. 当然, 并不是所有的论点都是令人认同的, 各取所需吧.

University of Arizona

So be it. I will choose U of Arizona to start my graduate education. The MIS program surely has its good bad and ugly, but it is one of the choices that I can make. Tucson is not a perfect place for graduate study and job hunting after that. I think anyway it is worth trying and I should stop doubting myself on such decisions.

Some updates on how to reach me:
MSN: hook_cn@hotmail.com

Email/Facebook/LinkedIN: kenneth.chjkh@gmail.com

Email of UA: kenjy@email.arizona.edu

QQ: 88237620

UA 09 FALL QQ Group: 80766835

短路SQL

日前在考试时脑子短路了,搞的很低,回来想想发现傻的一比。今天有空赶紧写下来,靠靠靠靠靠。。。唉,鄙视自己一下。
1. having子句是用在group by前面还是后面。正解:后面。Where用来筛选分组前的记录,having用来筛选分组后的记录。
2.两张表(大概是这意思):

T1.ID
T1.Value
1
a
2
b
3
c
T2.ID
T2.Value
2
a
3
b
4
c
写出以下三个查询的结果:
Select T1.value,T2.value from T1 LEFT JOIN T2 ON T1.ID=T2.ID;
结果:
a null
b a
c b
Select T1.value,T2.value from T1 LEFT JOIN T2 ON T1.ID=T2.ID where T1.ID=2;
结果:
b a
Select T1.value,T2.value from T1 LEFT JOIN T2 ON T1.ID=T2.ID and T1.ID=2;
结果:
a null
b a
c null

这下对了吧?

Windows Command 输出日期字符串

昨天在写一个应用的备份的批处理命令,想要根据备份执行的日期来命名文件。 作为一个很不入门的菜鸟, 我已经连基本的MS-DOS命令都不怎么想的起来了。 同事的脚本是用日期来建一个文件夹, 然后把备份放在里面, 我偏想直接用日期命名文件。 搜了一下, CSDN上有个太监贴, 同样的问题, 最后没有结果。 于是自己琢磨了一下, 结果如下:

C:\>date/t
2009-03-20 星期五

C:\>echo %date:~0,4%%date:~5,2%%date:~8,2%
20090320

C:\>set var1=%date:~0,4%%date:~5,2%%date:~8,2%

C:\>set var1
var1=20090320

C:\>echo %var1%
20090320

C:\>echo %date:~0,4%%date:~5,2%%date:~8,2%%date:~11,3%
20090320星期五

当 然,需要根据系统的日期格式进行调整。 然后新建文件的时候只要把这个字符串再加上一些标识符, 比如项目名称就可以每天有不重复的备份文件了。 有些东西,知道了就很简单, 不知道就很挫。 好比, 顺便还发现了Windows自己的makecab.exe程序的一些东西, 挺好用的。 关于makecab.exe能搜到很多, 我就不贴了, 提供别处搜不到的东西才是王道。

鲜果啊鲜果,抓虾啊抓虾,feedsky啊feedsky

1.先认领鲜果的频道 BANG315BF08EA37CC9AC63BBE4DEXIANGUO

2.鲜果为什么不认blogger默认的feed呢,为什么呢?

3.抓虾为什么抓取blogger的feed这么慢呢?

4.在国内到底用哪一种阅读器的人最多,bloglines? google reader? 抓虾?鲜果?

5.试试看feedsky吧,可是我为什么需要这样的二道贩子?

OtherInbox -- 别处的收件箱

总算有的偷闲了! 露个脸, 扯个淡!

先庆祝一下这个 二级域名在一个多月之后总算被Google索引了. 二级域名确实是索引的比较慢, 貌似早在半月前Google的爬虫就已经爬过了, 但是一直没有被索引. 不过要在Google上搜到这里的东西还要有耐心的点好几下"下一页", 如果目前这里真的有什么东西值得搜的话.

另外, 我对Blogger.com不能绑定一级域名这个事情一直耿耿于怀. 不过要让我看着GFW的脸色改解析, 还不如定心用个二级域名. 据传最近ghs.google.com又解封了, 可是还有几个人会回去启用Blogger的一级域名绑定呢, 太不稳定了. 域名就是互联网的门牌号, 人家看着你的门牌过来, 还得先问问GFW大哥, 都不知道你的房子在那还是不在那, 确实比较扯. 时不时的封一下, 没说不让你用, 但是让你不爽, 越看越觉着不像是意识形态的问题.

要再牛一点, 就自己买个空间自己弄博客 (其实, 依然可以随时被封). 可是对于我这种不够极客 (-.- 其实是没实力) 又不够有钱和闲的人来说是一笔不小的投资, 能搞点广告弄点小钱固然好, 不过这年头靠弄个博客或者搞个SEO赚钱已经不是那么容易的了. 一个免费的, 不用操心的, 稳定的又可以放小广告的博客就挺适合我的--比如Blogger.com. 博客广告, 包括显性的和隐性的还是很大的一块蛋糕, 但是每个人分到的却越来越少, 作为博客的终端用户能分到的更少, adsense单价也低了. 话说我那adsense的帐号还没申请到, 但是还是要继续写, 继续时不时submit一下, 为了人生完整.

Google很强大, 但是就像微软一样, 它不可能永远强大. 我前段时间一下子觉得Google在提供实时的信息这个方面很弱, 无论是它索引网络内容的方式还是显示搜索的方式. 它喜欢静态网页, 它喜欢静态内容. 这个靠着大量静态内容构建起来的互联网不可能一夜改变, 但是解决眼前之需的搜索和计算才是下一波的主流. 比如你在查Google地图时它不能告诉你罗秀路最近在修, 能不走就不走之类之类. 网友偶尔会添加类似的评论但是真正作为功能实现还很漫长.

我太能扯了, 就是都是没用的东西...
换行,继续...

今天把读写网上落下的帖子大概看了看, 发现一个有趣的东西, 叫OtherInbox. 自从看过了读写网我才知道互联网上新鲜东西出现的速度那叫一个快, 每天都有没见过的东西, 不过这个站点--应该说"服务"--我觉得还是有点小意思. 现在流行用一句话清楚说明新创公司的业务嘛, 这个业务就是替用户管理那些用户不想管的,又摆脱不掉的, 不重要的, 通常是商业消息,且通常不是由另一个自然人发来的电子邮件. 具体的说他主要提供两个东西: 一次性的邮件地址--用来填在那些你不想留下个人邮箱的商业表格上; 挖掘并管理那些商业邮件的收件箱--用来在你需要看这些东西的时候可以方便的找到.读写网的帖子: OtherInbox: Organize Your Non-Critical Email For Free
可以免费试用, 高级帐户20刀一年, 挺贵的. 它的方法是搜索你的GMAIL邮箱, 分析并找到那些它定性为商业广告类似的信息, 然后替你管理它们. 看截图:
我脚的吧, 明显还是那个一次性邮箱比较吸引人, 一般用Gmail的人都有好几个账号, 本身管理起来就挺方便的.

潜在的, 这个业务能搞起来说明几个问题:
1. GMAIL的内容是可以在授信的情况下被搜索和挖掘的, 隐私问题取决于Google到底能坚持不做恶多久; 不过你不可能更信任网易对不?
2. 以后的Web业务将更很细分, 所以说, 不要嫌生意小, 面对的市场可不是几万人而已;
3. 数据挖掘和分析以及基于此的信息, 金融, 决策业务还是有前途的; 希望老子交个好运~

欧了... 继续干活.

This is a test

在两会期间,ghs.google.com的最后的"漏网之鱼"很应景的被和谐了。于是Blogger的域名绑定也就随之歇菜了。。。也许以后会解封,但是谁也不知道。个人觉得频繁的换域名对搜索引擎来说总不是什么好事。

好吧,我暂时换到这个域名 "primekey.blogspot.com",和谐一段时间。希望。。。