问海量数据分布在100台电脑中,想个办法高效统计出这批数据的TOP10?
问给40亿个不重复的unsigned int的整数,没排过序的,然后再给一个数,如何快速判断这个数是否在那40亿个数当中?
问有一千万条短信,有重复,以文本文件的形式保存,一行一条,有重复。 请用5分钟时间,找出重复出现最多的前10条。
问100的阶乘末尾一共有几个零?
问有10个文件,每个文件1G,每个文件的每一行存放的都是用户的query,每个文件的query都可能重复。要求你按照query的频度排序。
问海量日志数据,如何提取出某日访问次数最多的那个IP?
关注互联网行业融资、上市、裁员、破产等发展大事件!