Вступление
Когда дело доходит до использования Python для копирования файлов, есть
два основных способа: использовать модуль shutil
или модуль os
Все
os
которые мы здесь показываем, являются методами, которые позволяют
нам выполнять команды оболочки из нашего кода Python, который мы будем
использовать для выполнения команды copy
(Windows) или команды cp
(Unix).
Вы заметите, что многие из этих методов, как в shutil
и в os
, имеют
очень похожую функциональность (что не должно вызывать удивления), но
каждый из них очень мало отличается по функциональности, что я объясню
как хорошо.
Копирование файлов с помощью модуля shutil
Модуль shutil предлагает несколько высокоуровневых методов копирования файлов. Вот основные из них:
копировать файл
Этот метод копирует содержимое одного файла в другой файл. Предоставленное ему место назначения должно быть файлом с возможностью записи и иметь другое имя, чем исходный файл. Если имена совпадают, это вызовет ошибку. Если целевой файл уже существует, он будет заменен вновь скопированным файлом.
Синтаксис этого метода:
shutil.copyfile(src_file, dest_file, *, follow_symlinks=True)
Например, следующий код скопирует файл с именем file1.txt в файл с именем file2.txt:
import shutil
shutil.copyfile('file1.txt', 'file2.txt')
Одна интересная и потенциально полезная функция shutil.copyfile
-
логический аргумент follow_symlinks
Если установлено значение False
и исходный файл является символической ссылкой, то вместо копирования
файла будет создана новая символическая ссылка.
копировать
Этот метод очень похож на copyfile
, с основным отличием в том, что он
не только копирует содержимое исходного файла, но и делает еще один шаг
вперед, а также копирует разрешения файловой системы. Копирование прав
доступа к файлам - нетривиальная задача для большинства языков
программирования, так что это хорошая возможность.
Синтаксис следующий:
shutil.copy(src_file, dest_file, *, follow_symlinks=True)
Каждый из этих параметров такой же, как и в методе copyfile
Например,
следующий код скопирует «file1.txt» в «file3.txt».
import shutil
shutil.copy('file1.txt', 'file3.txt')
Примечание . Убедитесь, что вы не называете свой скрипт таким же, как один из импортируемых модулей (что я ошибочно сделал при тестировании кода для этой статьи). Если вы это сделаете, вы получите сообщение об ошибке при попытке импортировать этот модуль из-за проблемы циклического импорта.
copy2
Как и предыдущие методы, метод copy2
copy
, но помимо копирования
содержимого файла он также пытается сохранить все метаданные исходного
файла. Если платформа не позволяет полностью сохранять метаданные, то
copy2
не возвращает ошибку, а просто сохраняет любые метаданные,
которые могут.
Синтаксис следующий:
shutil.copy2(src_file, dest_file, *, follow_symlinks=True)
Опять же, эти параметры такие же, как и в предыдущих командах, которые мы уже упоминали.
Например, следующий код скопирует «file1.txt» в «file4.txt», а также сохранит метаданные исходного файла «file1.txt».
import shutil
shutil.copy2('file1.txt', 'file4.txt')
$ python copy-files.py
$ ls -l
total 32
-rw-r--r-- 1 scott staff 91 Oct 27 11:26 copy-files.py
-rw-r--r-- 1 scott staff 6 Oct 27 11:27 file1.txt
-rw-r--r-- 1 scott staff 6 Oct 27 11:29 file3.txt
-rw-r--r-- 1 scott staff 6 Oct 27 11:27 file4.txt
Как видно из выполнения нашего кода выше, «file1.txt» был скопирован в
«file4.txt». Однако вы могли заметить, что дата создания была сохранена
в новом файле, в отличие от shutil.copy
, который копирует «file1.txt»
в «file3.txt» и дает ему новую дату создания.
copyfileobj
Этот метод копирует содержимое исходного файла в целевой файл из текущей
позиции исходного файла. Это означает, что если вы читаете данные из
объекта исходного файла, то позиция, в которой вы прекращаете чтение, -
это позиция, с которой copyfileobj
начинает копирование.
Синтаксис следующий:
shutil.copyfileobj(src_file_object, dest_file_object[, length])
Значения параметров исходного и целевого файлов аналогичны предыдущим командам, но теперь они относятся к объектам. Параметр длины является необязательным и представляет размер буфера, который представляет собой количество битов, хранящихся в памяти во время процесса копирования. Эта опция может быть полезна при копировании очень больших файлов, поскольку она может ускорить процесс копирования и избежать неконтролируемого использования памяти.
Например, следующий код скопирует "file1.txt" в "file5.txt"
import shutil
filename1 = 'file1.txt'
fileA = open(filename1, 'rb')
filename2 = 'file5.txt'
fileB = open(filename2, 'wb')
shutil.copyfileobj(fileA, fileB)
Как мы видим, чтобы использовать copyfileobj
, нам нужно открыть файлы
в двоичном режиме (который является частью «b» от «rb» и «wb»). Кроме
того, исходный файл должен быть открыт как доступный для чтения, а
целевой файл должен быть открыт как доступный для записи (части «r» и
«w» соответственно).
Копирование файлов с помощью модуля os
Модуль os предоставляет возможность использовать функциональные возможности операционной системы для копирования ваших файлов. В большинстве (если не во всех) примерах отсюда мы приводим примеры, которые работают как для Windows, так и для Unix. Примеры различаются из-за используемых команд оболочки, поэтому не забудьте обратить внимание на то, как каждый вызов функции помечен в комментариях Python.
открывать
Этот метод открывает канал к вашей команде или от нее. Однако обратите внимание, что этот метод устарел в Python 2.6, поэтому мы не рекомендуем его использовать, если в этом нет необходимости. В качестве альтернативы документация Python советует нам использовать вместо этого методы из модуля подпроцесса.
Синтаксис следующий:
os.popen(cmd[, mode[, bufsize]])
Здесь возвращаемое значение представляет собой файловый объект, подключенный к каналу. Этот объект может быть прочитан или записан в зависимости от режима. По умолчанию установлен режим «r», который позволяет читать содержимое файла.
В приведенном ниже примере файл file1.txt будет скопирован в file6.txt:
import os
# Windows
os.popen('copy file1.txt file6.txt')
# Unix
os.popen('cp file1.txt file6.txt')
Выполнение команды таким образом точно такое же, как если бы вы запускали ее непосредственно из командной строки вашего терминала.
система
Этот метод выполняет указанную команду в подоболочке. Он доступен как для Unix, так и для Windows. Синтаксис следующий:
os.system(command)
Здесь command
- это строка, содержащая команду оболочки DOS или Unix.
В нашем случае сюда мы поместим команду copy
или cp
.
Например, следующий код скопирует file1.txt в file7.txt.
import os
# Windows
os.system('copy file1.txt file7.txt')
# Unix
os.system('cp file1.txt file7.txt')
Это выглядит идентично предыдущей os.popen
мы только что использовали,
но команда выполняется в подоболочке, что означает, что она выполняется
в отдельном потоке параллельно с вашим исполняемым кодом. Чтобы
дождаться его завершения, вам нужно вызвать .wait()
для объекта,
возвращаемого os.system
.
Копирование файлов с помощью модуля подпроцесса
Модуль subprocess
предназначен для замены некоторых методов в os
(в частности,
os.system
и os.spawn*
), и он представляет два основных метода
доступа к командам операционной системы. Это методы call
и
check_output
. Еще раз, для систем Unix команду «copy file1.txt
file2.txt» следует заменить на «cp file1.txt file2.txt».
метод вызова
Документация Python рекомендует нам использовать call
для запуска
команды из операционной системы.
Синтаксис следующий:
subprocess.call(args, *, stdin=None, stdout=None, stderr=None, shell=False)
Параметр args
будет включать нашу команду оболочки. Однако небольшое
предостережение, поскольку документация Python предупреждает нас, что
использование shell=True
может представлять угрозу безопасности.
Используя этот вызов функции, мы можем запустить нашу команду копирования следующим образом:
import subprocess
# Windows
status = subprocess.call('copy file1.txt file8.txt', shell=True)
# Unix
status = subprocess.call('cp file1.txt file8.txt', shell=True)
Как показано в приведенном выше примере, нам просто нужно передать строку с помощью команды оболочки, как и раньше.
Как и ожидалось, операционная система скопирует file1.txt в файл с именем file8.txt.
check_output Метод
Этот метод также позволяет нам выполнять команду в оболочке. Это очень
похоже на subprocess.run
, за исключением того, что по умолчанию она
передает данные из stdout в виде закодированных байтов. Синтаксис
следующий:
subprocess.check_output(args, *, stdin=None, stderr=None, shell=False, universal_newlines=False)
Здесь args
включает команду оболочки, которую мы хотим использовать.
Еще раз, документация Python предупреждает нас об использовании
shell=True
, поэтому используйте этот метод с осторожностью.
В следующем коде мы скопируем «file1.txt» в «file9.txt» с помощью
команды check_output
:
import subprocess
# Windows
status = subprocess.check_output('copy file1.txt file9.txt', shell=True)
# Unix
status = subprocess.check_output('cp file1.txt file9.txt', shell=True)
И, как и все команды, которые мы показали в этой статье, это скопирует файл «file1.txt» в указанное нами место назначения, то есть «file9.txt» здесь.
Заключение
Python предлагает нам множество различных способов копирования файлов,
некоторые из которых являются частью набора методов Python. Другие
используют некоторые мощные методы Python для выполнения команд в
оболочке, которые используют команды оболочки, такие как copy
или cp
.
Не уверены, какой из них вам подходит? Здесь мы представили множество
различных способов копирования файлов, так что это понятно. Метод,
который вы используете для копирования файла, полностью зависит от вас и
зависит от ваших конкретных потребностей. Хотя в большинстве случаев вам
подойдет shutil
Попробуйте начать с shutil.copy2
и посмотрите,
подходит ли он вам.
Какой метод вы используете и почему? Дайте нам знать об этом в комментариях!