1英里 =1760 码 = 5280英尺
闹笑话了,最近在湾区开车的时候用Google地图导航:
导航总是在显示还有0.2英里的时候告诉我,还有1000英尺(我理解是还有200英尺啊)?
明明还有100英尺(我理解是还有0.1英里),怎么立刻就该拐弯了?
这不会是谷歌地图的Bug吧?
后来一查才知道:1英里等于5280英尺,怪不得……
闹笑话了,最近在湾区开车的时候用Google地图导航:
导航总是在显示还有0.2英里的时候告诉我,还有1000英尺(我理解是还有200英尺啊)?
明明还有100英尺(我理解是还有0.1英里),怎么立刻就该拐弯了?
这不会是谷歌地图的Bug吧?
后来一查才知道:1英里等于5280英尺,怪不得……
1 参加CES的中国厂商: 高调 vs. 平庸
法拉第电动的发布第二天在现场观察了一下:前去拍照的人挺多,很多人也是被前卫的造型惊呆了,听到不少人说:amazing, fantastic,也有人说ridiculous,另外一个比较抓眼球的是载人的亿航无人驾驶飞机。为乐视汽车/亿航的“高调”捏把汗,这些厂商如果今天挖了坑,可能需要国内同行用好几代产品去填。
相比互联网风格厂商的过于高调,中国传统家电厂商普遍缺乏创意:虽然展厅面积越来越大了,但展示的内容很空洞,产品定位相比较日韩厂商完全跟随,没特色。CES的参观者很多都是冲着新概念和开脑洞来的,如果只是把商场的专柜搬过去:就是完全浪费了在主会场的机会,需要订单的不如去参加广交会更好啊。
当然了,个人并非完全赞同互联网背景厂商的策略,但至少他们在CES主会场做了该做的事情,营销上还是及格的。传统家电厂商则完全还停留在去摆摊的阶段。
2 电动车:辅助驾驶 vs. 全自动 / 低速 vs. 高速
电动车分成高速电动车和低速电动车两个领域。
高速电动车和汽车领域在这届展出了大量和自动驾驶相关的技术:自动驾驶今年是热门,但我怎么觉得离得很远呢,或者自动驾驶根本不应该首先是个人使用的目标呢,自动驾驶有可能先在货运领域和全封闭道路环境下实现,而且自动驾驶的基础目前是图像视觉识别和雷达,成本过高,受气候等环境变化的影响太大。而且就算是自动驾驶实现了:也非常担心实际环境中的复杂变数。
更现实的是辅助驾驶/辅助停车有可能会短期内大量普及:类比下自动挡和倒车雷达在家用汽车领域的普及速度。
这次起亚KIA的智能驾驶解决方案挺实用的:
比如盲点区域的物体检测/报警:并线时候检测盲点区域和可能进入的车辆,减少碰撞,
并线报警:如果是无意识下的偏离当前车道会有并线警告;
遇到紧急情况的自动制动:避免追尾;
还有不规范的远光灯使用:
其他车辆灯光靠近后自动关闭远光灯(在某些国家应该强制配备)
根据道路坡度自动调整远光灯角度
相比高速电动车:低速电动车产品因为没有太多安全方面的强监管,反而有更快的进化速度。在滑板车领域:今年NineBot的展台比去年大了10倍:关注尝试的人非常多。通过在便携性,易学性上的改进,相信会比SegWay有更好的表现。能够放进一般汽车后备箱的两轮电动自行车/滑板还会有额外更多的使用场景。
3 VR 裸眼 vs. 头盔
各种全景摄像工具越来越成熟:让VR内容制作成本越来越低。但头盔真的是消费VR内容最佳的方式吗?尤其是家用场景下:一直像盲人一样戴着眼镜恐怕不是一般人可以习惯的。上次在MakerFaire 感受比较好的是理光的一个球幕投影,也许未来会有专用小帐篷来观看VR/球幕内容。
原文(英文)地址: http://www.mnot.net/cache_docs/ 版权声明:署名-非商业性使用-禁止演绎 2.0
这是一篇知识性的文档,主要目的是为了让Web缓存相关概念更容易被开发者理解并应用于实际的应用环境中。为了简要起见,某些实现方面的细节被简化或省略了。如果你更关心细节实现则完全不必耐心看完本文,后面参考文档和更多深入阅读部分可能是你更需要的内容。
内容摘要:
随着数码相机的普及,每次出游回来都会面对数量上百的照片整理,处理效率还是非常重要的因素。ACDSee
3.1(完整版)仍然是我目前最常用的照片查看/归档工具。以下是使用ACDSee进行照片整理和HTML相册生成的经验总结,大部分操作都可以完全只使
用键盘操作完成。
内容摘要:
在像网站首页这样的资源比较集中的页面中,那些栏目最经常被用户点击?居左居右对广告的点击率的影响是什么?
“一切用数字说话”:以上问题都可以通过跟踪浏览器客户端的鼠标行为,按区块对页面进行点击行为的分析。
如果说新一代搜索引擎Google所依赖的PageRank技术更真实的突出了超链接(hyperlink)在互联网中互联互通的本质,大型门户网站是否也应该反思一下传统的广告投放/统计模式,也许让广告回归到最原始的静态链接形式,通过间接提升广告客户自身网站在大型搜索引擎中的排名这种模式也许更能突出大型门户网站自身的优势。
你完全不必耐心的看完后面所有的内容,因为结论无非以下一句话: 互联网上链接就是一切:来自其他网站相关主题的直接静态链接是唯一对提升自身站点在搜索引擎中的排名提升有长期作用的广告形式。
内容摘要:
拥有大量的历史积累的各种论坛系统中的内容往往很难被搜索引擎收录,BBS2BLOG是一个bbs改造思路:通过对现有BBS加入按“个人”的归档机制,
让这些丰富内容都可以成为整个可搜索互联网知识库的一部分。
内容摘要:
GNU很推崇“工具箱”哲学:很多复杂的问题都可以通过几个更简单的工具通过一定的组合加以解决的。
shell 脚本本身的一些变量: $_ shell环境名称 如 /bin/sh ; $0 shell脚本本身,如 test.sh ; $1 $2 ..$9 命令行参数 test.sh -a -b 的$1 = -a $2 = -b
内容摘要:
对于一个日访问量达到百万级的网站来说,速度很快就成为一个瓶颈。除了优化
内容发布系统的应用本身外,如果能把不需要实时更新的动态页面的输出结果转化成静态网页来发布,速度上的提升效果将是显著的,因为一个动态页面的速度往往
会比静态页面慢2-10倍,而静态网页的内容如果能被缓存
在内存里,访问速度甚至会比原有动态网页有2-3个数量级的提高。
内容摘要:不得不承认,将动态网页链接rewriting成静态链接是最保险和稳定的面向搜索引擎优化方式
此外随着互联网上的内容以惊人速度的增长也越来越突出了搜索引擎的重要性,如果网站想更好地被搜索引擎收录,网站设计除了面向用户友好(User
Friendly)外,搜索引擎友好
(Search
Engine Friendly)的设计也是非常重要的。进入搜索引擎的页面内容越多,则被用户用不同的关键词找到的几率越大。在Google的算法调查一文
中提到一个站点被Google索引页面的数量其实对PageRank也是有一定影响的。由于Google
突出的是整个网络中相对静态的部分(动态网页索引量比较小),链接地址相对固定的静态网页比较适合被Google索引(怪不得很多大网站的邮件列表归档和BLOG按日期归档的文档很容被搜的到),因此很多关于面向搜索引擎
URL设计优化(URI
Pretty)的文章中提到了很多利用一定机制将动态网页参数变成像静态网页的形式:
比如可以将:
http://phpunixman.sourceforge.net/index.php?mode=man¶meter=ls
变成:http://phpunixman.sourceforge.net/index.php/man/ls
按此阅读全文 "Google排名优化-面向Google(Search Engine Friendly)的URL设计" »
内容摘要:
为Lucene做一个通用XML接口一直是我最大的心愿:更方便的在WEB应用中嵌入全文检索功能,2004年时类似应用还很不成熟,但现在也许应该优先试试以Lucene为核心的Solr全文应用引擎;
MySQL \ / JSP
Oracle - DB - ==> XML ==> (Lucene Index) ==> XML - ASP
MSSQL / - PHP
MS Word / \ / XHTML
PDF / =XSLT=> - TEXT
\ XML
\_________WebLucene__________/
使用过程如下:
你完全不必耐心看完所有内容:简要安装说明如下
安装
http://sourceforge.net/projects/awstats/ 下载安装包后:
GNU/Linux:tar zxf awstats-version.tgz
awstats的脚本和静态文件缺省都在wwwroot目录下:将cgi-bin目录下的文件都部署到 cgi-bin/目录下:/home/apache/cgi-bin/awstats/
mv awstats-version/wwwroot/cgi-bin /path/to/apache/cgi-bin/awstats
把图标等文件目录复制到WEB的HTML文件发布目录下,例如:/home/apache/htdocs/ 下发布
更多的批量更新脚本等在tools 目录下,可以一并放到cgi-bin/awstats/ 目录下
升级国内主要搜索引擎和蜘蛛定义,安装GeoIP的应用库:C
http://www.maxmind.com/download/geoip/api/c/ 解包,编译安装
perl -MCPAN -e 'install "Geo::IP"' 或者使用纯Perl包 perl -MCPAN -e 'install "Geo::IP::PurePerl"'
下载GeoIP/GeoIPCityLite包:解包并部署到awstats目录下:
wget http://geolite.maxmind.com/download/geoip/database/GeoLiteCity.dat.gz
wget http://geolite.maxmind.com/download/geoip/database/GeoLiteCountry/GeoIP.dat.gz
配置
将缺省awstats.model.conf 命名成common.conf
修改其中的一些配置选项:
LoadPlugin="decodeutfkeys"
LoadPlugin="geoip GEOIP_STANDARD /home/apache/chedong.com/cgi-bin/awstats/GeoIP.dat"
LoadPlugin="geoip_city_maxmind GEOIP_STANDARD /home/apache/chedong.com/cgi-bin/awstats/GeoLiteCity.dat"
创建awstats下创建:data 目录用于统计数据输出,缺省的统计输出是按月汇总的;对于日志非常大的最好选择按天统计输出,并修改awstats.pl: 设置LIMITFLUSH加10倍;
$LIMITFLUSH =
50000; # Nb of records in data arrays after how we need to flush data on disk
可以有效提高统计的速度(减少磁盘IO),并避免按月汇总数据导致的统计文件过大;
按照一下样例设置配置文件:
Include "common.conf"
LogFile="/home/apache/logs/access_log.%YYYY-24%MM-24%DD-24"
SiteDomain="www.chedong.com"
HostAliases="chedong.com"
DefaultFile="index.html"
DirData="/home/apache/cgi-bin/awstats/data/"
按此阅读全文 "AWStats简介:Apache/Windows IIS的日志分析工具的下载,安装,配置样例和使用(含6.9中文定义补丁)" »
内容摘要:
Google的使用如此重要,
O'Reilly有本专门的书介绍了如何优化网站面向Google的设计,和使用Google的一些技巧:
http://www.oreilly.com/catalog/googlehks/ 这里我很想把以前遇到类似问题时在Google上寻找资料的思路和大家分享一下:
内容摘要:
ant是一个基于JAVA的自动化脚本引擎,脚本格式为XML。除了做JAVA编译相关任务外,ANT还可以通过插件实现很多应用的调用。
内容摘要:本文主要介绍一些小组开发环境搭建中经常会遇到一些服务器服务设置,这些服务很多都是鉴于大部分的开发客户端仍然是Windows设置 的,每个服务都提供了简单的基本配置示范。包括:
很多设置是缺省按照在bash环境中,在tcsh环境中,有一些设置不太一致。
服务器规划如下:
__________________ _______________ |APACHE WEB SERVER | | File Backup | |SAMBA SHARE | | | |DHCP SERVER | | DHCP Backup | |CVS SERVER | | MySQL server| |WIKI/BLOG SERVER | <=Backup=> | | |Database backup | | | -------------------- ---------------
硬件准备:至少要2台服务器
内容摘要:
网站在搜索营销方面最主要的缺点:
RedHat 7.3/8 下的Oracle 8i安装笔记
硬件需求
========
至少256M物理内存
系统准备
========
redhat8按server方式安装需要增加的安装包大类:
1 包含一个X系统,建议使用GNOME,
2 将开发工具包DEVELOP TOOLS选上,标准的GCC工具等就有了。
3 建议将NETWORK UTILIETY选上,nmap mtr之类的小工具很有用
安装大约1.4G空间
安装后将语言环境设置缺省的en_US.UTF-8 (在RedHat 7.3下缺省是en_US.iso885915)改成en_US
root#vi /etc/sysconfig/i18n
改成:
LANG="en_US"
SUPPORTED="en_US:en"
介绍通过搜索引擎的一些隐含命令评价网站的“人气”。你完全不必耐心的看完后面所有的内容:因为他们已经过时了,http://www.alltheweb.com/提供了一个更加强大的反相链接统计工具:urlinfo
http://www.alltheweb.com/urlinfo?q=www.chedong.com
Lucene是一个基于Java的全文索引工具包。
内容摘要:
Java对输入输入首先有一个“字节流”到“字符流”之间的编码/解码过程,这个设置是根据系统配置决定的,为什么PHP之类的应用很少有字符集问题而Java有很好的国际化机制,却经常出现乱码问题呢?
简单的举例:
有一个包含“你好”这2个中文字的文件实际上是4个字节组成的:C4 E3 BA C3
在英文操作系统中缺省的编码解码方式是缺省编码方式是ISO8859,所以直接从文件中读取的结果是4个的字节,按ISO8859解码后在程序中操作的是4个Java字符,虽然每个JAVA字符是16位Unicode,但每个字符仍是8位字节的映射\u00C4\u00E3\u00BA\u00C3,因此处理的仍是“英文”。而显示过程中,是浏览器将字节流正确的显示成了相应的中文。
而一个Java应用在GBK编码方式的操作系统中,直接从文件中读取4个的字节后,按GBK方式解码后是2个16位的Java字符\u4F60\u597D,每个字都是相应Unicode的CJK区块所对应的中文。
更多的例子请参考:Java的中文处理学习笔记
这也就是为什么在php等应用很少出字符集问题的原因:在服务器端环境缺省一般是英文(ISO8859-1),等于全部处理使用的都是按字节方式处理的。数据输入输出过程中编码方式完全不被改动,因此乱码问题很少出现。而Java实际上提供了把每个中文直接当成1个“字”而不是2个字节处理的机制,主要的乱码问题往往是输入输出时编码解码方式不一致造成的。而且通过Unicode机制,程序除了实现程序界面根据本地化的适应外,甚至程序处理的内容本身的在不同字符集的操作系统中也是可以通用的,比如:在繁体中文操作系统中编辑的内容,在简体中文操作系统中也能正常的查询。以下例子可能更说明问题:
Google的XML数据格式定义:http://www.google.com/google.dtd
其它一些关于XSLT的演示文档:
XSL Tutorial 一个XSL教程,也是一个很好的XSLT在线手册:包括 XPATH XSLT函数参考和示例
在目前的Servlet的规范中,如果不指定的话通过WEB提交时的输入ServletRequest和输出时的ServletResponse缺省都是ISO-8859-1方式编/码解码的(注意,这里的编码/解码方式是和操作系统环境中的语言环境是无关的)。因此,即使服务器操作系统的语言环境是中文,上面输入的请求仍然按英文解码成8个UNICODE字符,输出时仍按照英文再编码成8个字节,虽然这样在浏览器端如果设置是中文能够正确显示,但实际上读写的是“字节”,正确的方式是应该根据客户端浏览器设置ServletRequest和ServletResponse用相应语言的编码方式进行输入解码/输入编码,HelloUnicodeServlet.java就是这样一个监测客户端浏览器语言设置的例子:
试验2的一些结论:
内容摘要:使用MySQL服务的一些经验,主要从以下几个方面考虑的MySQL服务规划设计。以下就是针对MySQL作为专门的数据库服务器的优化建议:
我想请教一下有没有显示内容在文本中的行号的解决方案啊!我也遇到了相同的问题
挺赞的文章,但是没有设计lucene的底层算法的介绍,这个是个缺陷吧,更偏向于应用的一篇好文章!
这个CVS有具体操作的讲解吗
看完你的java中文处理三篇,点起了很多疑问,弱弱的质疑一下,你是不是把encoding, decoding, 编码解码搞反了?由字符/图形/符号到数字码化的过程叫编码encoding,反之叫解码吧?
最后还是给部署出来了,但是没装GeoIP,不怎么会装啊,
你好,车东,我想请教一下有没有显示内容在文本中的行号的解决方案啊!
如何对超大请求量PV, 超大Index数据量,应如何做分布式?
楼主写的很细致,
来自德国的缓存设备单台设备可支持到1.5Gbps,命中率在50%-60%左右
更详细的信息,请访问HTTP://CACHE.MARASYSTEMS.ASIA
或HTTP://WEBCACHE.MARASYSTEMS.ASIA
车东大大,这篇2002年的文章现在还能帮上我的忙。
很大很大数据量的全文搜索应该追寻一个什么样的原则呢