Mysql学习笔记

建索引的几大原则(https://tech.meituan.com/mysql-index.html)(1)最左前缀匹配原则,非常重要的原则,mysql会一直向右匹配直到遇到范围查询(>、<、between、like)就停止匹配,比如a = 1 and b = 2 and c > 3 and d...

分布式系统学习笔记

分布式系统理论(https://www.liangzl.com/get-article-detail-3924.html)一个分布式系统最多只能同时满足一致性(Consistency)、可用性(Availability)和分区容错性(Partition tolerance)这三项中的两项 满足CP,舍弃A:典型例...

redis学习笔记

数据类型: 字符串(支持整型、浮点数等) 列表 集合 散列 有序集合 跳跃表是sortset底层实现,4层链表,加速查找速度。 持久化方式: 快照(一个时间的副本) AOF(记录命令) 缓存穿透 是指查询一个一定不存在的数据,由于缓存是不命中时需要从数据库查询,查不到数据则不写入缓存,这将导致这个不存在的数据...

go语言设计模式学习笔记

目录 单例模式 简单工厂模式 工厂方法模式 抽象工厂模式 策略模式 观察者模式 装饰者模式 命令模式 单例模式 单例模式确保程序中一个类最多只有一个实例 单例模式也提供访问这个实例的全局点 有一些对象其实我们只需要一个,比方说:线程池,缓存,对话框,处理偏好设置和注册表对象,日志对象等。事实上,这类对象只能有...

使用certbot为网站免费上https

前言自己做了个网站,由于增加了用户登录注册功能,想用https保护用户隐私。因此,研究如何启用https,本文即是介绍如何在ubuntu上配合Nginx使用CertBot。 Let’s Encrypt 及 Certbot 简介Let’s Encrypt 是 一个叫 ISRG ( Internet Security...

kafka学习笔记

选举机制Follower通过队列和zxid等顺序标识保证请求的顺序处理,一言不合就会重新同步Leader zxid是由epoch和计数器组成。 leader节点向follower发送心跳信息 如果zxid,epoch大于自身,就可以投票给leader 分布式partitions的目的有多个.最根本原因是kafka...

广告CTR预测算法综述

简述: 在计算广告系统中,一个可以携带广告请求的用户流量到达后台时,系统需要在较短时间(一般要求不超过100ms)内返回一个或多个排序好的广告列表。在广告系统中,一般最后一步的排序score=bid*pctralpha。其中alpha参数控制排序倾向,如果alpha<1,则倾向于pctr(预测点击率),否则...

利用Python对链家网北京主城区二手房进行数据分析

本文主要讲述如何通过pandas对爬虫下来的链家数据进行相应的二手房数据分析,主要分析内容包括各个行政区,各个小区的房源信息情况。 数据来源: 该repo提供了python程序进行链家网爬虫,并从中提取二手房价格、面积、户型和二手房关注度等数据。 本文所用到的代码放在本人的Github上,便于下载学习。 分析...

协同过滤算法概述

通常,协同过滤算法按照数据使用,可以分为: 基于用户(UserCF)—基于用户相似性 基于用户的协同过滤,通过不同用户对物品的评分来评测用户之间的相似性,基于用户之间的相似性做出推荐。简单来讲,就是给用户推荐和他兴趣相似的其他用户喜欢的物品。 上图示意出基于用户的协同过滤推荐机制的基本原理,假设用户 A 喜...

基于Spark的在线智能图书推荐系统

项目简介 基于Spark, Python Flask, 和 Book-Crossing Dataset 的在线图书推荐系统。 源代码地址:https://github.com/XuefengHuang/spark-book-recommender-system。 适合初学者学习如何搭建一个推荐系统,本文底下附有...