原文地址
微信、陌陌 架构方案分析
近两年、手机应用,莫过于微信、陌陌之类最受欢迎;但实现原理,分享文章甚少。
故,提出两种方案,供分享;不对之处,敬请留言学习。
目标
查找附近的某某某,由近到远返回结果,且结果中有与目标点的距离。
针对查找附近的某某某,提出两个方案,如下:
方案A:
本方案前,请先:基于LBS功能应用的Geohash方案,看过该文章便可简单知道;
1、仅需每分钟将用户的经纬度,上报到;2、然后每次用户查找附近好友时,通过 LIKE 'wm3yr3%',即可获取缺点:稍有一定数据量,对数据库的鸭梨可想而知
方案B:使用Redis
策略
假象把中国分成,若干个一平方公里的单元格
1)、用户位置的变更,理解为一个单元格移动到另外一个单元格(或者不移动)
2)、用户查找附近,理解为查找,自己所在方块的的所有人
数据结构
1)、用户基本信息 纬度、经度、GeoHash值(经纬度,仅用于后期距离计算)
2)、单元格 集合(用户1,用户2,…)
存储工具
1)、redis string(key->value) 结构,存储用户基本信息
2)、redis set(集合) 结构,以GeoHash值,前6位作为key(约表示一平方千米),存储单元格的用户群
算法流程
1)、更新用户信息,先删除用户原所在集合,再更新当前用户信息,最后更新当前用户所在集合
2)、查找附近,直接查找,所在单元格集合所有用户ID
具体实现
* @site http: //www.wubiao.info */ include_once ( 'geohash.class.php' ); class LBS { //索引长度 6位 protected $index_len = 6; protected $redis ; protected $geohash ; public function __construct() { //redis $this ->redis = new Redis(); $this ->redis->pconnect( '127.0.0.1' , '6379' ); //geohash $this ->geohash = new Geohash(); } /** * 更新用户信息 * @param mixed $latitude 纬度 * @param mixed $longitude 经度 */ public function upinfo( $user_id , $latitude , $longitude ) { //原数据处理 //获取原Geohash $o_hashdata = $this ->redis->hGet( $user_id , 'geo' ); if (! empty ( $o_hashdata )) { //原索引 $o_index_key = substr ( $o_hashdata , 0, $this ->index_len); //删除 $this ->redis->sRem( $o_index_key , $user_id ); } //新数据处理 //纬度 $this ->redis->hSet( $user_id , 'la' , $latitude ); //经度 $this ->redis->hSet( $user_id , 'lo' , $longitude ); //Geohash $hashdata = $this ->geohash->encode( $latitude , $longitude ); $this ->redis->hSet( $user_id , 'geo' , $hashdata ); //索引 $index_key = substr ( $hashdata , 0, $this ->index_len); //存入 $this ->redis->sAdd( $index_key , $user_id ); return true; } /** * 获取附近用户 * @param mixed $latitude 纬度 * @param mixed $longitude 经度 */ public function serach( $latitude , $longitude ) { //Geohash $hashdata = $this ->geohash->encode( $latitude , $longitude ); //索引 $index_key = substr ( $hashdata , 0, $this ->index_len); //取得 $user_id_array = $this ->redis->sMembers( $index_key ); return $user_id_array ; } } ?> |
性能测试
1)模拟数据上报
* @site http: //www.wubiao.info */ include_once ( 'lbs.class.php' ); $b_time = microtime(true); $n = 0; while (1) { //user_id 1~1000000 $user_id = rand(1, 1000000); //latitude 30.59773~30.726786 $rand_latitude = rand(30597730, 30726786); $latitude = $rand_latitude / 1000000; //longitude 103.983192 ~104.16069 $rand_longitude = rand(103983192, 104160690); $longitude = $rand_longitude / 1000000; $lbs = new lbs(); $lbs ->upinfo( $user_id , $latitude , $longitude ); $n ++; mylog( $n ); $e_time = microtime(true); if (( $e_time - $b_time ) >= 60) { exit ; } } function mylog( $content ) { file_put_contents ( 'upinfo.log' , $content . "\r\n" , FILE_APPEND); } ?> |
2)模拟附近查找
* @site http: //www.wubiao.info */ include_once ( 'lbs.class.php' ); $b_time = microtime(true); $n = 0; while (1) { //latitude 30.59773~30.726786 $rand_latitude = rand(30597730, 30726786); $latitude = $rand_latitude / 1000000; //longitude 103.983192 ~104.16069 $rand_longitude = rand(103983192, 104160690); $longitude = $rand_longitude / 1000000; $lbs = new lbs(); $re = $lbs ->serach( $latitude , $longitude ); $n ++; mylog( $n ); $e_time = microtime(true); if (( $e_time - $b_time ) >= 60) { exit ; } } function mylog( $content ) { file_put_contents ( 'search.log' , $content . "\r\n" , FILE_APPEND); } ?> |
测试环境
vmWare,内存256M,主频2.93GHz
性能结果
模拟了100W活跃用户行为,不断更新,不断查找附近好友
1 2 3 4 5 6 7 8 | //60 seconds insert 88544 //60 seconds search 117660 //成都 100W人,数据占用内存 11 .97M |
总结
从测试结果来看,完全能满足,微信、陌陌之类的性能要求;
尚可改进之处:
1、Geohash,可写成 C扩展;或者其他Geohash实现方式
2、Redis,内存消耗较大,可考虑redis集群方案
3、本文仅查出本单元格用户,提高精度,可查出周围八个单元个,求交集
4、求出结果,如需按照由远到近排序;读出Redis经纬度,利用距离公式排序方可。(可参照上一篇文章)
问题
1)假设我现在设定的hash长度为7 ,那一个个hash值对应一个块,如何得到这个块的坐标区间呢?
例如,成都永丰立交的Geohash值为:wm3yr31d2524;如取7位,则为,wm3yr31;
根据Geohash的算法,那么区间就会是 wm3yr3100000 ~ wm3yr31zzzzz;
根据如上两值,通过“Geohash->经纬度”算出经纬度,可大致确定区间。
2)如果用户上报的位置信息有时效性(比如:15秒内有效)如何处理?
可以在redis存储的时候,设置有效时间
http://www.2cto.com/weixin/201504/393787.html