サイトアイコン ITC Media

【簡単】Pythonで文字列を分割する方法 7つ全てを徹底解説

python

(最終更新日:2023年7月)

✔このような方へ向けて書かれた記事となります

「Pythonで文字列を分割する方法って何だろう?」
「Pythonで文字列分割をする際の書き方を知りたい」
「Pythonを使った文字列分割の具体的な例が見たい」

✔当記事を通じてお伝えすること

当記事では、Pythonで文字列を分割する基本的な手法に始まり、さまざまなオプションを利用して効率的に文字列を分割する方法まで、実際のコードサンプルを交えてわかりやすく解説します。

最後までご覧ください。

筆者プロフィール

【現職】プロダクトマネージャー

【副業】ブログ(月間20万PV)/YouTube/Web・アプリ制作

「プログラミング × ライティング × 営業」の経験を活かし、30後半からのIT系職へシフト。現在はプロダクトマネージャーとして、さまざまな関係者の間に入り奮闘してます。当サイトでは、実際に手を動かせるWebアプリの開発を通じて、プログラミングはもちろん、IT職に必要な情報を提供していきます。

【当ブログで紹介しているサイト】

当サイトチュートリアルで作成したデモ版日報アプリ

Django × Reactで開発したツール系Webアプリ

✔人に見せても恥ずかしくないコードを書こう

「リーダブルコード」は、わかりやすく良いコードの定義を教えてくれる本です。

  • 見るからにきれいなコードの書き方
  • コードの分割方法
  • 変数や関数の命名規則

エンジニアのスタンダートとすべき基準を一から解説しています。

何回も読むのに値する本なので、ぜひ手にとって読んでみてください。

Pythonと文字列の理解

こちらでは、Pythonと文字列についての基本をご覧いただきます。

Pythonがどのように文字列を扱うかを把握しましょう。

Pythonの文字列とは?

Pythonでは、文字列は一連の文字として表されます。

これは、ダブルクォート(”)またはシングルクォート(’)で囲まれた文字のシーケンスです。

たとえば、「Hello, World!」はPythonの文字列です。

文字列は不変(immutable)であり、作成後は変更できません。

Pythonでの文字列操作の基本

Pythonでは、文字列に対してさまざまな操作が可能です。

文字列メソッドを使用して、大文字化、小文字化、分割などの操作できます。

文字列操作の例

Pythonの文字列操作に関する例をいくつか示します。

連結

str1 = "Hello"
str2 = "World"
result = str1 + " " + str2
print(result)  # 出力: "Hello World"
【Python】文字列を結合するさまざまな手法を実例付きで解説
Pythonの文字列を結合する方法について知りたいですか?当記事では、Pythonの文字列を結合する方法について、さまざまな方法の書き方から実例までを一挙に解説しています。サンプルコードをみて手を動かしながら、学べるようになっています。初心者の方は必見です。

スライス

text = "Python"
slice1 = text[0:2]  # 最初の2文字を取得
slice2 = text[2:]  # 2番目以降の文字を取得
print(slice1)  # 出力: "Py"
print(slice2)  # 出力: "thon"
【必読】Pythonのスライスを基本から応用まで実例付きで解説
Pythonのスライスについて知りたいですか?スライスは、リストや文字列などのシーケンス型を部分的に抽出するための強力なツールです。当記事では、Pythonでのスライスの使用法を具体的なコード付きで詳しく解説しています。特にPython初心者の方は必読です。

置換

text = "Hello, World!"
replaced_text = text.replace("Hello", "Hi")
print(replaced_text)  # 出力: "Hi, World!"
【必読】Pythonのreplace関数をマスター|実例付き
Pythonのreplace関数について知りたいですか?当記事では、PythonのReplaceメソッドの基本的な使い方や実用的な例を詳細に解説しています。さまざまな場面別の具体例がついているので、初心者の方でも簡単に学べる必見の内容です。

大文字化・小文字化

text = "Hello, World!"
upper_text = text.upper()  # 大文字に変換
lower_text = text.lower()  # 小文字に変換
print(upper_text)  # 出力: "HELLO, WORLD!"
print(lower_text)  # 出力: "hello, world!"

分割

text = "Apple, Banana, Cherry"
split_list = text.split(", ")
print(split_list)  # 出力: ['Apple', 'Banana', 'Cherry']

文字列の重要性

Pythonでは、文字列について学ぶことはとても重要です。

以下にいくつかの重要なポイントを挙げます。

  1. データの表現と入力: 文字列はテキストデータを表現するための基本的な要素です。ユーザーからの入力や外部ファイルの読み書きなど、多くの場面で文字列を使用します。
  2. 文字列操作と処理: Pythonでは、文字列に対してさまざまな操作や処理が可能です。文字列の結合、分割、置換、検索、スライスなど、多様な操作を行うことができます。
  3. テキスト処理と解析: テキストデータの解析や処理には、文字列の操作が必要不可欠です。文字列のパターンマッチング、正規表現を使用したテキストの抽出、トークン化など、テキストデータを効果的に扱うための機能が提供されています。
  4. メッセージやログの表示: プログラムの実行時にメッセージやログを表示する際に、文字列は非常に重要です。エラーメッセージ、デバッグ情報、ユーザーへのフィードバックなど、さまざまな情報を文字列として出力する必要があります。
  5. 文字列のフォーマットと表示: Pythonでは、文字列内に変数や値を埋め込んで表示するためのフォーマット機能が提供されています。文字列内に変数を挿入したり、整数や浮動小数点数を特定の形式で表示することができます。

これらは文字列の重要性の一部ですが、Pythonにおいて文字列は広範かつ重要な役割を果たしています。

プログラミングやデータ処理において、文字列を適切に理解し、操作することは非常に重要です。

split()メソッドとその応用

split()メソッドの基本的な使用方法とその応用した方法をお伝えします。

split()メソッドの紹介

split()メソッドは、Pythonの文字列を特定の区切り文字で分割し、リストとして返します

デフォルトでは、空白文字(スペース、タブ、改行)で分割。

これはテキストデータを解析する際に非常に便利です。

区切り文字で分割する方法

区切り文字を指定して分割する方法をご覧いただきます。

デフォルトの方法だけでなく、何で区切るかを自由に設定できるのです。

区切り文字の指定

split()メソッドに区切り文字を指定できます。

たカンマで区切られた文字列を分割する場合、split(',')のようにしてカンマを区切り文字として指定しましょう。

string = "apple,banana,orange"
fruits = string.split(',')

print(fruits)  # ['apple', 'banana', 'orange']

最大分割回数を制限する

split()メソッドの2つ目の引数には、最大分割回数を指定できます。

これにより、指定した数の部分に分割されます。

例えば、split(',', 1)を使用すると、カンマで区切られた文字列を最初のカンマで1回だけ分割します。

string = "apple,banana,orange"
fruits = string.split(',', 1)

print(fruits)  # ['apple', 'banana,orange']

デリミタを使った分割

デリミタとは、データの区切りを示す文字のこと。

split()メソッドを使って、複数のデリミタで文字列を分割できます。

例えば、セミコロンやコロンなど、異なるデリミタを持つ文字列を分割する場合に便利です。

string = "apple;banana:orange,cherry"
fruits = string.split(';:,')

print(fruits)  # ['apple', 'banana', 'orange', 'cherry']

rsplit()で右から分割

rsplit()メソッドを使って文字列を右側から分割する方法をご紹介します。

rsplit()メソッドの紹介

rsplit()メソッドは、split()メソッドと異なり、右側から分割を開始します。

文字列の末尾にあるデリミタを基に分割する場合に便利です。

string = "apple,banana,orange,cherry"
fruits = string.rsplit(',', maxsplit=2)

print(fruits)  # ['apple,banana', 'orange', 'cherry']

使い方と応用例

rsplit()split()と同様に、区切り文字と最大分割回数を指定できます。

例えば、ドットで区切られたドメイン名を右から分割してサブドメインを取得する場合などに便利です。

domain = "itc.tokyo"
parts = domain.split('.')

print(parts)  # ['itc', 'tokyo']

改行で分割する方法

文字列内の改行を使って分割する方法を学びましょう。

splitlines()メソッドの使い方

splitlines()メソッドは、文字列内の改行を使って文字列を分割します。

これは、複数行のテキストを行ごとのリストに分割する際に非常に便利です。

改行文字は、結果のリストに含まれません。

text = "Hello\nWorld\nWelcome\nto\nPython"
lines = text.splitlines()
print(lines)

# 出力
# ['Hello', 'World', 'Welcome', 'to', 'Python']

三分割: partition()とrpartition()

partition()とrpartition()を使って、文字列を前後に三分割する方法。

partition()メソッドの紹介

partition()メソッドは、指定した区切り文字で文字列を三分割します。

区切り文字の前、区切り文字自体、区切り文字の後、の3つの部分からなるタプルを返します。

このメソッドは、区切り文字を基にテキストをセグメント化する際に便利です。

text = "Hello,World,Python"
segments = text.partition(",")
print(segments)

# 出力
# ('Hello', ',', 'World,Python')

rpartition()メソッドの紹介

rpartition()は、partition()と異なり、右側から検索を開始するものです。

これは、文字列の末尾近くにあるデリミタを基に分割する場合に使用します。

text = "Hello,World,Python"
segments = text.rpartition(",")
print(segments)

# 出力
# ('Hello,World', ',', 'Python')

正規表現を使った分割

正規表現を使用して、パターンに基づいて文字列を分割する方法です。

より細かい文字列の分割が指定できます。

正規表現とは?

正規表現は、文字列のパターンを表現するための強力な言語です。

これにより、繰り返し、ワイルドカード、オプションの文字などを使用して、複雑なパターンを定義できます。

【保存版】Pythonの正規表現をコード付きで徹底解説|初心者向け
Pythonの正規表現について知りたいですか?当記事では、Pythonでの正規表現の基本的な使い方や実践的な例を詳細に解説しています。具体例を交えて解説しているで、コードを見ながら実際に手を動かして学べます。初心者の方は必見です。

re.split()メソッドを使った分割

Pythonのreモジュールには、正規表現を使用して文字列を分割するre.split()メソッドが含まれています。

複数のパターンや複雑なパターンを使用して、文字列を分割が可能です。

import re
text = "apple,banana,orange;grape"
# カンマまたはセミコロンを区切り文字として文字列を分割
segments = re.split("[,;]", text)
print(segments)

複数の異なる区切り文字で分割する方法

正規表現を使用すると、複数の異なる区切り文字で文字列を一度に分割できます。

たとえば、正規表現'[;,]'を使用して、セミコロンまたはカンマで文字列を分割が可能です。

import re
text = "apple;banana,orange;grape"
# セミコロンまたはカンマを区切り文字として文字列を分割
segments = re.split("[;,]", text)
print(segments)

# 出力
# ['apple', 'banana', 'orange', 'grape']

正規表現の応用例

正規表現は非常に強力で、電話番号、メールアドレスなどの特定のパターンを抽出するのにも使用できます。

また、テキストデータのクリーニングや前処理にも役立ちます。

import re

text = "お問い合わせは、support@example.comまたは012-345-6789までご連絡ください。"

# メールアドレスの抽出
email_pattern = r"\b[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Za-z]{2,}\b"
emails = re.findall(email_pattern, text)

# 電話番号の抽出
phone_pattern = r"\b\d{3}-\d{3}-\d{4}\b"
phones = re.findall(phone_pattern, text)

print("メールアドレス:", emails)
print("電話番号:", phones)

# 出力
# メールアドレス: ['support@example.com']
# 電話番号: ['012-345-6789']

文字数で分割

文字数で分割する方法を見ていきましょう。

やり方はいくつかあるので、場面ごとやあなたに合う方法をお選びください。

スライスの基本

スライスは、文字列の部分を抽出するための機能です。

[start:stop:step]

startからstopまでの範囲をstepの間隔で抽出します。

以下は、文字列textの最初の5文字を取得する例です。

text = "Hello, World!"

# 先頭から5文字を抽出
substring1 = text[0:5]
print(substring1)  # Output: Hello

# インデックス1からインデックス6の手前までの文字列を抽出
substring2 = text[1:6]
print(substring2)  # Output: ello,

# 全体の文字列を逆順で抽出
reversed_text = text[::-1]
print(reversed_text)  # Output: !dlroW ,olleH

X文字ずつ分割する方法

スライスを使用して、文字列を特定の文字数ごとに分割できます。

forループと組み合わせて、文字列を一定のサイズのチャンクに分割する際に使用します。

def chunk_string(string, chunk_size):
    chunks = []
    for i in range(0, len(string), chunk_size):
        chunk = string[i:i+chunk_size]
        chunks.append(chunk)
    return chunks

text = "Hello, World!"
chunk_size = 3

result = chunk_string(text, chunk_size)
print(result)  # Output: ['Hel', 'lo,', ' Wo', 'rld', '!']

スライスの応用例

スライスは非常に柔軟で、逆順にする、偶数番目の文字だけを取得するなど、さまざまな方法で文字列を操作できます。

データの解析やテキスト処理を効率的におこないましょう。

# 逆順にする例
text = "Hello, World!"
reversed_text = text[::-1]
print(reversed_text)  # Output: "!dlroW ,olleH"

# 偶数番目の文字だけを取得する例
text = "Hello, World!"
even_chars = text[1::2]
print(even_chars)  # Output: "el,Wr!"

実例: ファイルのテキストを分割する

こちらでは、実例のひとつとして、ファイルテキストを分割するコードをご紹介します。

具体例を参考に、手を動かして、学んでいきましょう。

テキストファイルの読み込み

Pythonでテキストファイルを読み込むには、open()関数を使用します。

ファイルを開き、read()メソッドを使用して内容を文字列として読み取れるのです。

# テキストファイルを開いて内容を読み取る
with open('example.txt', 'r') as file:
    content = file.read()

# 読み取った内容を表示する
print(content)

行ごとの分割

テキストファイルの内容を行ごとに分割する場合、splitlines()メソッドやreadlines()メソッドが便利です。

テキストファイルの各行をリストの要素として扱えます。

# テキストファイルを開いて内容を行ごとに分割する
with open('example.txt', 'r') as file:
    lines = file.read().splitlines()

# 各行の内容を表示する
for line in lines:
    print(line)

CSVファイルの処理

CSVファイルは、カンマで区切られた値が含まれるテキストファイルです。

Pythonのcsvモジュールを使用すると、CSVファイルを簡単に読み取り、各行をリストとして処理できます。

import csv

# CSVファイルを開いて内容を読み取る
with open('example.csv', 'r') as file:
    reader = csv.reader(file)
    
    # 各行のデータを処理する
    for row in reader:
        # 各行のデータを表示する
        print(row)

まとめ

当記事では、Pythonで文字列を分割するさまざまな方法を学びました。

これには、基本的なsplit()メソッド、正規表現、スライスなどが含まれます。

これらの知識を活かして、テキストデータの処理を効率的におこないましょう。

モバイルバージョンを終了