本文记录使用 es-hadoop【版本 v5.6.8】组件,运行 Spark 任务时遇到的异常:
1 | Caused by: java.io.EOFException |
以及通过 Maven 依赖查找分析问题的方法,最后给出解决此类问题的总结建议。
本文记录使用 es-hadoop【版本 v5.6.8】组件,运行 Spark 任务时遇到的异常:
1 | Caused by: java.io.EOFException |
以及通过 Maven 依赖查找分析问题的方法,最后给出解决此类问题的总结建议。
本文讲述使用 Spark 的过程中遇到的错误:
1 | class "javax.servlet.FilterRegistration"'s signer information does not match signer information of other classes in the same package |
最终通过查找分析 Maven 依赖解决问题。
地锅鸡是流行于皖北、苏北地区的一道传统名菜,并经过改良产生了地锅鱼、地锅豆腐、地锅牛肉、地锅三鲜等一系列菜品,但是配饼始终不变,一般是面饼或者玉米饼。本文用于记录地锅鸡做法总结。
我的博客一开始是搭建在阿里云上面的,购买了一台 VPS,然后在上面部署了 Git 仓库服务、Nginx 服务,同时也购买了一个域名。每次在本地写完博客,generate 后,直接使用 Hexo 自带的 deploy 命令把内容发布,同时在服务端的 Git 里面再设置一个 WebHook,触发自动拉取更新到 Nginx 项目目录的操作。这样,只要安心在本地写博客就行,写完就 generate、deploy 两下,看似很完美。
然而,使用了几个月就发现了各种麻烦事,例如:VPS 流量不够【恶意攻击或者爬虫】、VPS 服务不稳定【怀疑是被恶意攻击】、每次都要在本地生成【generate 命令】、两台电脑的环境配置不一致导致的兼容性问题、博客的整个管理还是略显繁琐。于是,我思考了好几天,并查看了别的成熟案例,最终决定使用 GitHub、travis-ci 搭配,完全的自动化测试部署,本地只负责写 Markdown 文档。这种方案才是真的简约、安全、方便。
最近在使用 Win10 系统,遇到一个问题,每次开机,Skype for Business 都会自动弹出来,提示登录,每次我都会关掉它。遇到多次之后,我想这个应用我不需要,直接卸载掉算了,但是却找不到这个应用的信息,最后只能通过关闭 开机自动启动 的方式来解决问题,本文记录解决问题的过程。
最近处理数据的过程中,发现一个奇怪的问题,处理数据逻辑如下:有一个短字符串,我需要从一个长字符串寻找这个短字符串是否出现。这个逻辑很简单,使用任何一种编程语言,基本上都会有 包含 这种方法,直接就可以判断了,但是我遇到的情况明明就是包含了,子串就是存在,但是判断结果却不包含。另外我又直接把 2 个字符串单独取出来,肉眼去看,也是包含的。愁眉苦展之际,突然灵光闪现:会不会字符串中包含一些奇怪的特殊字符,并且肉眼难以发现。于是立马去验证一下,果然是这样,解决了我的问题,本文记录解决这个小问题的过程。
今天在使用 IntelliJ IDEA 时,发现在 Maven 项目中无法创建 Java 类【在 test 目录创建测试用例】,哪怕手动创建了一个 Java 类文件,IDEA 也无法识别,说明项目的设置有问题。后来检查了一下,发现文件夹类型没有设置为项目的 测试文件夹 。
开发环境基于 Windows 10、IntelliJ IDEA 2017.2。
在 Java 开发过程中,使用 Maven 往私服 deploy 构件【Java 打成的 jar 包】的时候,原本正常的流程突然出问题了,报错信息:
1 | [WARNING] Could not transfer metadata org.leapframework:leap:0.4.0b-SNAPSHOT/maven-metadata.xml from/to bingo-maven-repository-hosted ($bingo.maven$): sun.security.validator.ValidatorException: PKIX path building failed: sun.security.provider.certpath.SunCertPathBuilderException: unable to find valid certification path to requested target |
看到里面的 security 和 certification 关键词就猜测是安全与证书的问题。恰好最近私服的域名访问从 http 升级为了 https,也就是增加了 SSL 证书,我想可能和这个有关。本文就记录解决这个问题的流程,以及后续由此又引发了其它的问题,例如 JDK8 导致的注解问题、IDEA 的乱码问题。
对微博数据有了解的人都知道,一条微博内容对应有唯一的微博 url,同时对微博官方来说,又会生成一个 mid,mid 就是一条微博的唯一标识【就像 uid 是微博用户的唯一标识一样】,也类似于人的身份证号。其实,微博 url 里面有一串看起来无意义的字符【称之为 id,由字母、数字组成,6-9 个字符长度,当然以后也可能会变长】,可以和 mid 互相转换,本文就根据理论以及 Python 版本的实现,讲解微博 id 与 mid 的互相转换过程。