廖雪峰java-线程
廖雪峰java-网络编程网络编程基础12计算机网络互联网
IP地址123456IPv4和IPv6公网IP地址和内网IP地址本机地址网络号 子网掩码网关路由
域名1域名解析服务器DNS
网络模型12OSITCP/IP
常用协议123IP协议TCP协议UDP协议
TCP编程12Socket0~1024~65535
服务器端客户端UDP编程12UDP0~65535
HTTP编程123456TCP 使用80端口和加密端口443GETPOSTHTTP/1.0 HTTP/1.1 HTTP/2.0 目前HTTP 3.0仍然处于实验阶段HttpURLConnection HttpClient
RMI远程调用发送Email接收Email
廖雪峰java-设计模式创造型模式工厂方法抽象工厂生成器原型单例结构型模式适配器桥接组合装饰器外观享元代理行为型模式
DataFrame常用用法积累(df)len(df)1查看有多少行
df(),dtype={}123pd.DataFrame(xxx,dtype={'xx':float})当某一列有缺失值时,不可以将该列数据类型设置成int,需要设置成float,str等
df..astype()1dataFrame类型转换
1Tweets = pd.DataFrame(data).astype({'user_id':'Int64', 'tweet_id':'Int64','tweet':'object','tweet_date':'object'})
.dtypes1df.dtypes 查看数据类型
.sort_values()1数据排序,可以是多列作为参数进行排
.head(3) .tail(3).isnull().describe(xx)12345678 ...
Pandas-Series常用用法积累series.between1["tweet_date"].between("2024-02-01", "2024-02-29")
series.isin([])1order[['dishes_id','dishes_name']][order['dishes_name'].isin(['内蒙古烤羊腿','xxx'])]
series.str123https://zhuanlan.zhihu.com/p/30894133https://blog.csdn.net/weixin_43750377/article/details/107979607
.str.cat.str.split.str.findall(r”#\w+”)1hashtags = tweets_feb_2024["tweet"].str.findall(r"#\w+")
.str ...
Pandas刷题Leecode刷题176.第二高的薪水123456789101112131415161718192021import pandas as pddef second_highest_salary(employee: pd.DataFrame) -> pd.DataFrame: # 1. 删除所有重复的薪水. employee = employee.drop_duplicates(["salary"]) # 2. 如果少于 2 个不同的薪水,返回 `np.NaN`。 if len(employee["salary"].unique()) < 2: return pd.DataFrame({"SecondHighestSalary": [np.NaN]}) # 3. 把表格按 `salary` 降序排序。 employee = employee.sort_values(by="salary", asc ...
Pandas学习-SeriesSeries创建series通过列表list12345678910111213使用列表和数组创建的Series数组则是副本,改变其中一个不会影响另一个。>>> from pandas import Series,DataFrame>>> s=Series([2,1,5,4,3])>>> s0 21 12 53 44 3dtype: int64>>> type(s)<class 'pandas.core.series.Series'>
123series默认index是从0 - N-1可以使用.values keys index获取对应类型数据
1234567891011>>> s.keys<bound method Series.keys of 0 21 12 53 44 3dtype: int64>>>> s.valuesarray([2, ...
Pandas学习-DataFrame参考
123pandas是一个python的第三方库,是一个易于使用的数据结构和数据分析工具。在数据探索,数据转换,数据清洗中常用。pandas包含两种数据结构,series和dataframe。前者处理一维数据(类似list),后者处理二维数据(类似二维数组或者表)。
123456789特点:-数据清理和预处理:Pandas提供了一系列功能,用于处理丢失数据(缺失值)、重复数据、异常值、数据类型转换等,以使数据变得更加干净和可用于分析。-数据选择和过滤:Pandas允许使用标签和位置进行数据选择和过滤,包括布尔索引、条件过滤、列选择等。-数据分组和聚合:Pandas支持数据分组操作,可以对数据进行分组并执行聚合操作,如求和、均值、计数等-合并和连接:Pandas提供了多种方法来合并和连接不同的数据集,包括数据库风格的连接、拼接和合并操作。-时间序列处理:Pandas内置了强大的时间序列功能,支持时间索引和时间相关的操作,适用于处理时间序列数据。-数据可视化:Pandas可以与Matplotlib等数据可视化库集成,帮助用户快速绘制图表和图形,以更 ...
数据分析 Python数据分析师2020特训营-Pandas DataFrame 1Excel及CSV等数据获取与保存12345pandas内置了10多种数据源读取函数,常见的就是CSV和EXCELpandas读取出来的数据直接是数据框格式,方便后续的数据处理和分析可以快速的将数据保存为CSV或者EXCEL格式参数较多,可以自行控制,但很多时候用默认参数读取CSV时,注意编码,常用编码为utf-8,gbk,gbk2312等
更改python获取数据的路径123import osos.getcwd()os.chdir()
数据类型1234int64 float64 object:字符串或者字符datetime64:格式化后的时间timedelta64:时间戳
read_csv1pd.read_csv('xxx.csv',encoding='gbk')
,encoding123常用的有gbk gbk2312 utf-8# 数据包含中文读取报错的话,可以试试中文gbk,gbk2312编码或者utf-8
,dtype={‘xx’ ...






