Вступление
Pandas - это библиотека Python для анализа
и обработки данных. Почти все операции в pandas
вращаются вокруг
DataFrame
s.
Dataframe
- это абстрактное представление двумерной таблицы, которая
может содержать все виды данных. Они также позволяют нам давать имена
всем столбцам, поэтому часто столбцы называются атрибутами или полями
при использовании DataFrames
.
В этой статье мы увидим, как мы можем переименовать уже существующие
DataFrame
.
Есть два варианта управления именами столбцов DataFrame
:
- Переименование столбцов существующего
DataFrame
- Назначение имен пользовательских столбцов при создании нового
DataFrame
Давайте посмотрим на оба метода.
Переименование столбцов существующего фрейма данных
У нас есть образец DataFrame
ниже:
|
|
DataFrame
df
выглядит так:
Чтобы переименовать столбцы этого DataFrame
, мы можем использовать
метод rename()
который принимает:
- Словарь в качестве
columns
содержащий сопоставление исходных имен столбцов с именами новых столбцов в виде пар ключ-значение boolean
значение в качествеinplace
, которое, если установлено вTrue
, внесет изменения в исходныйDataframe
Давайте изменим имена столбцов в нашем DataFrame
с Name, age
на
First Name, Age
.
|
|
Теперь наш df
содержит:
Назначьте имена столбцов при создании фрейма данных
Теперь мы обсудим, как назначать имена столбцам при создании DataFrame
.
Это особенно полезно, когда вы создаете DataFrame
из csv
и хотите
игнорировать имена столбцов заголовков и назначить свои собственные.
Передав список names
, мы можем заменить уже существующий столбец
заголовка нашим собственным. В списке должно быть имя для каждого
столбца данных, в противном случае создается исключение.
Обратите внимание: если мы хотим переименовать только несколько
столбцов, лучше использовать метод rename
DataFrame
после его
создания.
Мы будем создавать DataFrame
используя out.csv
, который имеет
следующее содержимое:
|
|
Обратите внимание, что первая строка в файле является строкой заголовка
и содержит имена столбцов. Pandas по умолчанию назначает имена столбцов
DataFrame
из первой строки.
Следовательно, мы укажем игнорировать строку заголовка при создании
нашего DataFrame
и укажем имена столбцов в списке, который передается
в аргумент names
|
|
Это приводит к:
Другой способ сделать это - указать имена столбцов в простом старом
конструкторе DataFrame()
.
Единственное отличие состоит в том, что теперь параметр, который
принимает список имен column
называется столбцом вместо names
:
|
|
Это приводит к другому DataFrame
:
Заключение
В этой статье мы быстро рассмотрели, как мы можем называть и
переименовывать столбцы в DataFrame
. Либо путем присвоения имен при
DataFrame
экземпляра DataFrame, либо путем переименования их после
факта с помощью метода rename()