Python数据科学平台JupyterLab学习笔记

219次阅读
没有评论

共计 2467 个字符,预计需要花费 7 分钟才能阅读完成。

JupyterLab 是 Jupyter Notebook 的升级版。

安装:pip install jupyterlab,启动:jupyter lab

JupyterLab 官网:https://jupyter.org/

默认文件保存路径

查看 JupyterLab 默认文件保存路径:

import os
os.path.abspath('.')

快捷键

编辑模式快捷键

编辑模式即 cell 编辑模式,可使用以下快捷键:

快捷键 作用 说明
Esc 切换到命令模式
Ctrl+Enter 运行本单元
Shift+Enter 运行本单元,选中下一单元 新单元默认为命令模式
Alt+Enter 运行本单元,在下面插入一单元 新单元默认为编辑模式
Ctrl+Up 跳到单元开头,或者 Ctrl+Home
Ctrl+Down 跳到单元末尾,或者 Ctrl+End
Ctrl+Left 跳到左边一个字首
Ctrl+Right 跳到右边一个字首

命令模式快捷键

退出 cell 编辑模式,即可使用命令模式快捷键:

快捷键 作用 说明
Enter 进入编辑模式
Y 单元转入 code 状态
M 单元转入 markdown 状态
R 单元转入 raw 状态
1 设定 1 级标题 仅在 markdown 状态下时建议使用,如果单元处于其他状态,则会强制切换到 markdown 状态

代码格式化

JupyterLab 本身并不支持代码格式化,需要安装 jupyterlab_code_formatter 插件:pip install jupyterlab_code_formatter

插件 jupyterlab_code_formatter 支持 Python 常见的代码格式化包,如 autopep8、black、isort 等,
插件安装完成后,需要安装 Python 代码格式化包。

插件默认支持 isort 和 black 包,安装这两个包后续会避免很多问题,安装命令:pip install black isort

重启 JupyterLab,点击 JupyterLab 左侧栏插件图标,在 INSTALLED 列表下,可看到 jupyterlab_code_formatter 已安装。

格式化方式

最简单的方式是通过鼠标右键菜单来格式化代码:右键 -> Format cell。

也可通过工具栏按钮来格式化代码,在笔记本上方工具栏中有一个格式化按钮。单击按钮会对单元格进行代码格式化。

另外,可以设置保存笔记本自动格式化代码:Settings -> Settings Editor -> Jupyterlab Code Formatter -> Auto format config。

使用

import pandas as pd
import matplotlib.pyplot as plt
plt.rcParams['font.sans-serif'] = 'SimHei' # 设置中文显示
## 行命令,将图表直接嵌入到 Notebook 之中
%matplotlib inline

# 1. 加载数据
data1=pd.read_excel('1.xlsx', sheet_name='sheet1')
data2=pd.read_excel('2.xlsx', sheet_name='sheet2')

data=pd.concat([data1,data2], axis=0) # 按行拼接
data.head(5)
data.info()

# 2. 数据清洗
# 2.1 数据预处理(重复值、缺失值、格式调整)data.drop_duplicates(keep='first', inplace=True) # 删除重复记录
data.dropna(axis=1, inplace=True) # 按列删除 NA 列并修改源数据

data.dropna(axis=0, how='any', inplace=True) # 删除有 NA 的整行数据

# 格式调整
def data_deal(number):
    new_number += 1
    return new_number
data['新列'] = data['列'].map(data_deal)

## 2.2 异常值处理
data.describe()
data = data[data['金额'] != 0] # 数据量小可以采用直接删除

data.drop(columns=['列'], inplace=True, axis=1) # 删除列
data.reset_index(drop=True, inplace=True) # 更新索引

# 3. 数据规整
## 时间提取
data['time'] = pd.to_datetime(data['字符串时间'])
data['hour'] = data['time'].dt.hour
data['minute'] = data['time'].dt.minute
data['month'] = data['time'].dt.month

# 4. 数据分析
round(data['列'].mean(), 2) # 求平均
dishes_count = data['列'].value_counts()[:10] # 频数统计,取前 10

# 分组求和
group_sum = data[['列 1', '列 2', '列 3']].groupby(by='列 1').sum()
sort_counts = group_sum.sort_values(by='列', ascending=False) # 降序排序

data['列'] = data['列'].str.strip()
data.groupby(['月份', '列']).size().unstack()

# 5. 数据可视化
dishes_count.plot(kind='line', color=['r']) # 折线图
dishes_count.plot(kind='bar', fontsize=16, color=['r','b', 'g']) # 直方图
plt.title('标题')
plt.xlabel('x 轴', fontsize=16)
plt.ylabel('y 轴', fontsize=16)
for x,y in enumerate(dishes_count):
    plt.text(x, y+2, y, ha='center', fontsize=12) # 水平居中显示 

正文完
 0
阿伯手记
版权声明:本站原创文章,由 阿伯手记 于2024-01-22发表,共计2467字。
转载说明:本站原创内容,除特殊说明外,均基于 CC BY-NC-SA 4.0 协议发布,转载须注明出处与链接。
评论(没有评论)
验证码

阿伯手记

阿伯手记
阿伯手记
喜欢编程,头发渐稀;成长路上,宝藏满地
文章数
766
评论数
204
阅读量
401088
今日一言
-「
热门文章
职场救急!AI请假话术生成器:1秒定制高通过率理由

职场救急!AI请假话术生成器:1秒定制高通过率理由

超级借口 不好开口?借口交给我!智能生成工作请假、上学请假、饭局爽约、约会拒绝、邀约推辞、万能借口等各种借口理...
夸克网盘快传助手提高非VIP下载速度

夸克网盘快传助手提高非VIP下载速度

夸克网盘限速这个大家都知道,不开会员差不多限速在几百 K。那有没有办法在合法合规途径加速下载夸克网盘呢?这里推...
国内已部署DeepSeek模型第三方列表 免费满血版联网搜索

国内已部署DeepSeek模型第三方列表 免费满血版联网搜索

本文收集了目前国内已部署 DeepSeek 模型的第三方列表,个个都是免费不限次数的满血版 DeepSeek,...
TVAPP:开源电视盒子资源库,一键打造家庭影院

TVAPP:开源电视盒子资源库,一键打造家庭影院

导语 TVAPP 是一个专为 Android TV 电视盒子用户打造的开源影音资源库,集成了影视、直播、游戏等...
巴别英语:用美剧和TED演讲轻松提升英语听力与口语

巴别英语:用美剧和TED演讲轻松提升英语听力与口语

还在为枯燥的英语学习而烦恼吗?巴别英语通过创新的美剧学习模式,让英语学习变得生动有趣。平台提供海量美剧和 TE...
2025年12月 每日精选

2025年12月 每日精选

关于每日精选栏目 发现一些不错的资源,点击 这里 快速投稿。 12 月 26 日 .ax 顶级域 目前全球唯一...
Chinese Name Generator 在线中文姓名生成器

Chinese Name Generator 在线中文姓名生成器

Chinese Name Generator 是一款在线中文姓名生成器,可在几秒内生成符合个人需求的中文名字。...
最新评论
15220202929 15220202929 怎么用
八对 八对 麻烦大佬更新下【堆新】的友链站名:八对星星描述:极目星视穹苍无界•足履行者大地有疆链接:https://8dui.com图标:https://cf.8dui.com/logo.webp横标:https://cf.8dui.com/logo-w.webp订阅:https://8dui.com/rss.xml
三毛笔记 三毛笔记 已添加
DUINEW DUINEW 已添加贵站,期待贵站友链~博客名称:堆新博客地址:https://duinew.com/博客描述:堆新堆新,引力向新!——堆新(DUINEW)博客头像:https://d.duinew.com/logo.webp横版头像:https://d.duinew.com/logo-w.webp博客订阅:https://duinew.com/rss.xml
hedp hedp 没看懂
bingo bingo 直接生成就可以啦,也可以添加一些选项
满心 满心 申请更新下友联信息,原名:满心记,现名:周天记原域名:qq.mba,现域名:zhoutian.com描述:我在人间混日子
开业吉日 开业吉日 没看明白这个怎么用
开业吉日 开业吉日 beddystories 这个网站太赞了,收藏
热评文章
夸克网盘快传助手提高非VIP下载速度

夸克网盘快传助手提高非VIP下载速度

夸克网盘限速这个大家都知道,不开会员差不多限速在几百 K。那有没有办法在合法合规途径加速下载夸克网盘呢?这里推...
国内已部署DeepSeek模型第三方列表 免费满血版联网搜索

国内已部署DeepSeek模型第三方列表 免费满血版联网搜索

本文收集了目前国内已部署 DeepSeek 模型的第三方列表,个个都是免费不限次数的满血版 DeepSeek,...
清华大学官方免费DeepSeek教程

清华大学官方免费DeepSeek教程

AI 领域近期最引人注目的焦点当属 DeepSeek,这款由中国创新企业深度求索研发的人工智能工具,正以开放源...
Short-Link 免费开源短网址程序,基于Fastify、Vercel和Supabase构建

Short-Link 免费开源短网址程序,基于Fastify、Vercel和Supabase构建

Short-Link 是一款基于 Fastify、Vercel 和 Supabase 构建的 URL 缩短服务...
Chinese Name Generator 在线中文姓名生成器

Chinese Name Generator 在线中文姓名生成器

Chinese Name Generator 是一款在线中文姓名生成器,可在几秒内生成符合个人需求的中文名字。...
BeddyStories 完全免费儿童睡前故事库,让孩子随时随地入睡更轻松

BeddyStories 完全免费儿童睡前故事库,让孩子随时随地入睡更轻松

BeddyStories 是一个致力于为儿童提供优质睡前故事的在线平台,用户可以在这里找到来自世界各地的经典故...
WebRTC Screen Mirror:基于浏览器免费开源投屏神器,可实现低延迟、跨平台屏幕共享

WebRTC Screen Mirror:基于浏览器免费开源投屏神器,可实现低延迟、跨平台屏幕共享

WebRTC Screen Mirror 是一款基于 WebRTC 技术的在线屏幕共享工具,它利用浏览器内置的...