讨论一道面试题啊(take home task)

作者：wangpugod2003 发布时间：2024-4-14 17:00:51

题目很简单，就是一个文件，里面的数据就是 ID->value：
[u]
例如：
123131321 100
135235423 101
132523121 80
...
给定一个值 n ，返回最大的 n 个值的 ID:
比如上面 n=2 ，就应该返回:
135235423
123131321
就是个 top k 的问题，也不要求返回的 id 的顺序。唯一的要求是这个文件极端的大。
我理解单个文件，哪怕几百 G 吧，我直接 java 中按照 BufferedReader 一行行的读，再用 size 为 n 的 PriorityQueue 梳理一遍整个[i]value>即可，时间复杂度就是 O(lines * logn)。
也写了单元测试+集成测试，各种不合法的 corn case 都处理了，生成了个 10G 的文件(几十亿条)测试了就一分多钟就出来结果。不知道怎么提交上去还是挂了。。
大家觉得应该用啥高级些的算法么？

zhy0216 2024-4-14 17:01:45

size 为 k 就够吧每一个和最小的比较大才进这个堆

讨论一道面试题啊(take home task)

浏览过的版块

热门主题

终于知道百度为啥大量k站只剩首页了

经济持续下行情况下，哪些行业反而会繁荣啊

真正免费邮箱，无任何利益需求

我觉得阿里巴巴可能是穷疯了，所以才dns涨

时至今日，你们还用中转站吗？

阿里云DNS收费以后，还有以下可用

现在电商已经把实体店眼镜价格也打下来了，

玩网盘的真是牛吖这站长日入上千吖

装win 11系统，系统自带的中文简体体验包是

逗号这个域名，感觉挺值钱的吧各位大佬？

热门板块

公告

网站帮助 - Yoo趣儿

我们的愿景

在 Yoo趣儿投放广告

Yoo趣儿网站用户应遵守规则

讨论一道面试题啊(take home task)

浏览过的版块

热门主题

终于知道百度为啥大量k站只剩首页了

经济持续下行情况下，哪些行业反而会繁荣啊

真正 免费邮箱，无任何利益需求

我觉得阿里巴巴可能是穷疯了，所以才dns涨

时至今日，你们还用中转站吗？

阿里云DNS收费以后，还有以下可用

现在电商已经把实体店眼镜价格也打下来了，

玩网盘的真是牛吖 这站长日入上千吖

装win 11系统，系统自带的中文简体体验包是

逗号这个域名，感觉挺值钱的吧 各位大佬？

热门板块

公告

网站帮助 - Yoo趣儿

我们的愿景

在 Yoo趣儿 投放广告

Yoo趣儿网站用户应遵守规则

真正免费邮箱，无任何利益需求

玩网盘的真是牛吖这站长日入上千吖

逗号这个域名，感觉挺值钱的吧各位大佬？

在 Yoo趣儿投放广告