虾丸派

烂笔头


  • 首页

  • 标签

  • 分类

  • 归档

  • 关于

  • 书籍

  • 指南

  • 搜索

Spark Kryo 异常

发表于 2018-10-08 | 分类于 基础技术知识
字数统计 1,615字 | 阅读时长 ≈ 6分钟

本文记录使用 es-hadoop【版本 v5.6.8】组件,运行 Spark 任务时遇到的异常:

1
2
3
Caused by: java.io.EOFException
at org.apache.spark.serializer.KryoDeserializationStream.readObject (KryoSerializer.scala:232)
at org.apache.spark.broadcast.TorrentBroadcast$.unBlockifyObject (TorrentBroadcast.scala:217)

以及通过 Maven 依赖查找分析问题的方法,最后给出解决此类问题的总结建议。

阅读全文 »

依赖包缺失导致 Spark 任务无法启动

发表于 2018-10-07 | 分类于 基础技术知识
字数统计 1,046字 | 阅读时长 ≈ 4分钟

本文讲述使用 Spark 的过程中遇到的错误:

1
class "javax.servlet.FilterRegistration"'s signer information does not match signer information of other classes in the same package

最终通过查找分析 Maven 依赖解决问题。

阅读全文 »

地锅鸡做法总结(皖北、苏北地区)

发表于 2018-10-06 | 分类于 菜谱
字数统计 1,428字 | 阅读时长 ≈ 5分钟

地锅鸡是流行于皖北、苏北地区的一道传统名菜,并经过改良产生了地锅鱼、地锅豆腐、地锅牛肉、地锅三鲜等一系列菜品,但是配饼始终不变,一般是面饼或者玉米饼。本文用于记录地锅鸡做法总结。

阅读全文 »

Hexo 博客集成 travis-ci 自动化测试发布

发表于 2018-10-02 | 分类于 建站
字数统计 5,827字 | 阅读时长 ≈ 22分钟

我的博客一开始是搭建在阿里云上面的,购买了一台 VPS,然后在上面部署了 Git 仓库服务、Nginx 服务,同时也购买了一个域名。每次在本地写完博客,generate 后,直接使用 Hexo 自带的 deploy 命令把内容发布,同时在服务端的 Git 里面再设置一个 WebHook,触发自动拉取更新到 Nginx 项目目录的操作。这样,只要安心在本地写博客就行,写完就 generate、deploy 两下,看似很完美。

然而,使用了几个月就发现了各种麻烦事,例如:VPS 流量不够【恶意攻击或者爬虫】、VPS 服务不稳定【怀疑是被恶意攻击】、每次都要在本地生成【generate 命令】、两台电脑的环境配置不一致导致的兼容性问题、博客的整个管理还是略显繁琐。于是,我思考了好几天,并查看了别的成熟案例,最终决定使用 GitHub、travis-ci 搭配,完全的自动化测试部署,本地只负责写 Markdown 文档。这种方案才是真的简约、安全、方便。

阅读全文 »

Win10 取消 Skype for Business 自动登录

发表于 2018-09-07 | 分类于 知识改变生活
字数统计 727字 | 阅读时长 ≈ 3分钟

最近在使用 Win10 系统,遇到一个问题,每次开机,Skype for Business 都会自动弹出来,提示登录,每次我都会关掉它。遇到多次之后,我想这个应用我不需要,直接卸载掉算了,但是却找不到这个应用的信息,最后只能通过关闭 开机自动启动 的方式来解决问题,本文记录解决问题的过程。

阅读全文 »

踩坑特殊字符之硬空格

发表于 2018-09-06 | 分类于 基础技术知识
字数统计 1,421字 | 阅读时长 ≈ 5分钟

最近处理数据的过程中,发现一个奇怪的问题,处理数据逻辑如下:有一个短字符串,我需要从一个长字符串寻找这个短字符串是否出现。这个逻辑很简单,使用任何一种编程语言,基本上都会有 包含 这种方法,直接就可以判断了,但是我遇到的情况明明就是包含了,子串就是存在,但是判断结果却不包含。另外我又直接把 2 个字符串单独取出来,肉眼去看,也是包含的。愁眉苦展之际,突然灵光闪现:会不会字符串中包含一些奇怪的特殊字符,并且肉眼难以发现。于是立马去验证一下,果然是这样,解决了我的问题,本文记录解决这个小问题的过程。

阅读全文 »

归来

发表于 2018-09-05 | 分类于 基础技术知识
字数统计 181字 | 阅读时长 ≈ 1分钟

好,整理完成后,重新出发。

阅读全文 »

在 IDEA 中管理 Java 项目的文件夹类型

发表于 2018-09-01 | 分类于 基础技术知识
字数统计 959字 | 阅读时长 ≈ 3分钟

今天在使用 IntelliJ IDEA 时,发现在 Maven 项目中无法创建 Java 类【在 test 目录创建测试用例】,哪怕手动创建了一个 Java 类文件,IDEA 也无法识别,说明项目的设置有问题。后来检查了一下,发现文件夹类型没有设置为项目的 测试文件夹 。

开发环境基于 Windows 10、IntelliJ IDEA 2017.2。

阅读全文 »

Maven 使用中遇到的证书问题以及 JDK8 问题

发表于 2018-08-25 | 分类于 基础技术知识
字数统计 5,683字 | 阅读时长 ≈ 22分钟

在 Java 开发过程中,使用 Maven 往私服 deploy 构件【Java 打成的 jar 包】的时候,原本正常的流程突然出问题了,报错信息:

1
[WARNING] Could not transfer metadata org.leapframework:leap:0.4.0b-SNAPSHOT/maven-metadata.xml from/to bingo-maven-repository-hosted ($bingo.maven$): sun.security.validator.ValidatorException: PKIX path building failed: sun.security.provider.certpath.SunCertPathBuilderException: unable to find valid certification path to requested target

看到里面的 security 和 certification 关键词就猜测是安全与证书的问题。恰好最近私服的域名访问从 http 升级为了 https,也就是增加了 SSL 证书,我想可能和这个有关。本文就记录解决这个问题的流程,以及后续由此又引发了其它的问题,例如 JDK8 导致的注解问题、IDEA 的乱码问题。

阅读全文 »

微博 id mid 相互转换算法实现 - Python 版本

发表于 2018-07-18 | 分类于 基础技术知识
字数统计 838字 | 阅读时长 ≈ 4分钟

对微博数据有了解的人都知道,一条微博内容对应有唯一的微博 url,同时对微博官方来说,又会生成一个 mid,mid 就是一条微博的唯一标识【就像 uid 是微博用户的唯一标识一样】,也类似于人的身份证号。其实,微博 url 里面有一串看起来无意义的字符【称之为 id,由字母、数字组成,6-9 个字符长度,当然以后也可能会变长】,可以和 mid 互相转换,本文就根据理论以及 Python 版本的实现,讲解微博 id 与 mid 的互相转换过程。

阅读全文 »
1…101112…15
虾丸派

虾丸派

记录知识 | 分享技术

144 日志
13 分类
294 标签
RSS
GitHub 微博 E-Mail
Creative Commons
友情链接
  • GitHub
  • Weibo
  • 虾丸派
  • playpi
  • 廖雪峰
  • 阮一峰
  • travis-ci
  • Vultr
© 2016–2021 | 虾丸派 | 全站字数统计 326.3k 字
由 Hexo 强力驱动
|
主题 NexT.Mist| 总访问量 次 | 总访客 人
0%