プログラム系統備忘録ブログ

記事中のコードは自己責任の下でご自由にどうぞ。

AlpacaHack Round 4 (Rev) write-up

AlpacaHack Round 4 (Rev)へ参加しました。そのwrite-up記事です。

コンテスト概要

2024/10/05(土) 12:00 +09:00 - 10/05(土) 18:00 +09:00の6時間開催でした。他ルールはコンテストページから引用します:

AlpacaHack Round 4 (Rev) へようこそ!
AlpacaHack は個人戦の CTF を継続して開催する新しいプラットフォームです。

AlpacaHack Round 4 は AlpacaHack で行われる 4 回目の CTF で、Rev カテゴリから 4 問が出題されます。 幅広い難易度の問題が出題されるため、初心者を含め様々なレベルの方に楽しんでいただけるようになっています。 問題作成者は xornet、keymoon、ptr-yudai です!

参加方法
1. 右上の「Sign Up」ボタンから AlpacaHack のユーザー登録をしてください。
2. 登録完了後、このページの「Register」ボタンを押して CTF の参加登録をしてください。

注意事項
- AlpacaHack は個人戦のCTFプラットフォームであるため、チームでの登録は禁止しています。
- 問題は運営が想定した難易度の順に並んでいます。
- 問題の配点は解いた人数に応じて変動します。
- 全てのアナウンスは AlpacaHack の Discord サーバー で行われます。
  - アナウンスは本サービス上でも行うことがありますが、Discord サーバーが主な連絡手段となります。
  - 問題が発生した場合、#ticket チャンネルから連絡してください。ただし、問題のヒントは提供しません。
- 競技システム自体への攻撃は行わないでください。なお、偶然発見したバグの報告は歓迎します。

Round 2~3同様に問題は運営が想定した難易度の順に並んでいますと明記されており、並び順で想定難易度が示されました。また、コンテスト開始前に別途NOTE: 3問目と4問目の推定難易度は同程度です。というアナウンスもありました。

結果

正の得点を得ている43人中、146点で13位でした:

順位と得点等

チェック印: 解けた問題

また、Certificate箇所から順位の証明書も表示できます:

環境

WindowsのWSL2(Ubuntu 24.04)を使って取り組みました。

Windows

c:\>ver

Microsoft Windows [Version 10.0.19045.4957]

c:\>wsl -l -v
  NAME                   STATE           VERSION
* Ubuntu-24.04           Running         2
  docker-desktop-data    Running         2
  kali-linux             Stopped         2
  docker-desktop         Running         2
  Ubuntu-22.04           Running         2

c:\>

他ソフト

  • IDA Free Version 9.0.240925 Windows x64 (64-bit address size)(Free版IDAでもversion 7頃からx64バイナリを、version 8.2からはx86バイナリもクラウドベースの逆コンパイルができます)

WSL2(Ubuntu 24.04)

$ cat /proc/version
Linux version 5.15.153.1-microsoft-standard-WSL2 (root@941d701f84f1) (gcc (GCC) 11.2.0, GNU ld (GNU Binutils) 2.37) #1 SMP Fri Mar 29 23:14:13 UTC 2024
$ cat /etc/os-release
PRETTY_NAME="Ubuntu 24.04.1 LTS"
NAME="Ubuntu"
VERSION_ID="24.04"
VERSION="24.04.1 LTS (Noble Numbat)"
VERSION_CODENAME=noble
ID=ubuntu
ID_LIKE=debian
HOME_URL="https://www.ubuntu.com/"
SUPPORT_URL="https://help.ubuntu.com/"
BUG_REPORT_URL="https://bugs.launchpad.net/ubuntu/"
PRIVACY_POLICY_URL="https://www.ubuntu.com/legal/terms-and-policies/privacy-policy"
UBUNTU_CODENAME=noble
LOGO=ubuntu-logo
$ python3 --version
Python 3.12.3
$ python3 -m pip show pwntools | grep Version:
Version: 4.13.0
$ python3 -m pip show tqdm | grep Version:
Version: 4.66.4
$ gdb --version
GNU gdb (Ubuntu 15.0.50.20240403-0ubuntu1) 15.0.50.20240403-git
Copyright (C) 2024 Free Software Foundation, Inc.
License GPLv3+: GNU GPL version 3 or later <http://gnu.org/licenses/gpl.html>
This is free software: you are free to change and redistribute it.
There is NO WARRANTY, to the extent permitted by law.
$ pwninit --version
pwninit 3.3.1
$

解けた問題

[Rev] Simple Flag Checker (42 solves, 146 points)

A simple flag checker :)

配布ファイルとして、checkerがありました:

$ file *
checker: ELF 64-bit LSB pie executable, x86-64, version 1 (SYSV), dynamically linked, interpreter /lib64/ld-linux-x86-64.so.2, BuildID[sha1]=c2dd390ecbb794a78e20db0151832e9dd5c6359d, for GNU/Linux 3.2.0, not stripped
$

IDAで開いて解析しました。main関数は次の内容でした(変数名の変更や型付けを行った後です):

int __fastcall main()
{
  __int64 dwIndex; // rbx
  int bSucceeded; // r12d
  __m128i converted; // [rsp+0h] [rbp-98h] BYREF
  __int64 v4; // [rsp+10h] [rbp-88h]
  __int64 v5; // [rsp+18h] [rbp-80h]
  int v6; // [rsp+20h] [rbp-78h]
  char strInput50[56]; // [rsp+30h] [rbp-68h] BYREF
  unsigned __int64 v8; // [rsp+68h] [rbp-30h]

  v8 = __readfsqword(0x28u);
  __printf_chk(1LL, "flag? ");
  fgets(strInput50, 50, stdin);
  converted = 0uLL;
  v4 = 0LL;
  v5 = 0LL;
  v6 = 0;
  dwIndex = 0LL;
  LOBYTE(bSucceeded) = 1;
  do
  {
    update(&converted, strInput50[dwIndex]);
    bSucceeded = (memcmp(&converted, table[dwIndex++], 0x10uLL) == 0) & (unsigned __int8)bSucceeded;
  }
  while ( dwIndex != 49 );
  if ( bSucceeded )
  {
    __printf_chk(1LL, "Correct! Your flag is: %s\n", strInput50);
    return 0;
  }
  else
  {
    puts("Wrong...");
    return 1;
  }
}

main関数は次のことを行うと分かります:

  1. 標準入力から、終端のNUL文字を除いて、最大49文字を受け付けます。
  2. ループ中で、入力された文字を先頭から1文字ずつ処理します。
  3. update関数へ、第1引数を入出力両方として、第2引数の今回処理する文字を入力のみとして渡します。update関数は何らかの変換を行い、第1引数のポインタ変数へ変換結果を格納します。
  4. update関数により更新された第1引数内容と、グローバル変数table内容の各要素16バイトと一致しているか、memcmp関数で比較します。
  5. 49回のループ全てでtable内容と一致する場合に正解判定となり、Correct! Your flag is:を表示するルートに入ります。

さて、update関数を見てみると、SIMD命令やビット演算命令が大量に並んでいました。あまりにも複雑なので読解をすぐに諦めました。一方でupdate関数中では、グローバル変数を参照しておらず、別の関数呼び出し等も行っていないため、update関数への入力が同一なら変換結果も同一になりそうなことも確認しました。

(なお、コンテスト中ではupdate関数の第1引数のポインタ変数が出力専用と誤解していました。そのため「update関数の変換結果は文字種のみに依存し、文字の位置へは依存しない」と誤解してしまっていました。実際は前述の通り、update関数の第1引数は入力としても使われます。)

解くための方法として、次の方法を考えました:

  1. GDB経由でcheckerバイナリを実行します。
  2. 入力先頭から順番に、1文字ずつ総当たりで探索します。
  3. 結果を比較するためのmemcmp呼び出し時にブレークさせて、引数内容を確認します。
  4. update関数の出力結果と、table内容が一致しているかを確認します。一致している場合は正解の文字としてみなし、次の文字の探索へ進みます。

なお、今となってはmemcmp関数の処理完了にブレークさせて、戻り値だけを確認するのがもっと手っ取り早い方法だと思います。前述の誤解などや試行錯誤の結果、memcmp関数の呼び出し時にブレークさせる方針を取っていました……。

上述の発想でソルバーを書きました。GDBの自動操作にはpwntoolsライブラリを使いました。また、時間がかかるのでtqdmライブラリを使って進捗を表示しました:

#!/usr/bin/env python3

import pwn
import tqdm

pwn.context.log_level = "CRITICAL"  # プロセス起動ログを抑制

# .data:0000000000004020     table
table = bytes.fromhex(

)


def get_updated_value(flag_input: str, index: int) -> bytes:
    PROMPT = b"(gdb)"
    io: pwn.tube
    with pwn.process(["gdb", "-q", "--nx", "./checker"]) as io:
        # memcmpがmain前でも使われるようなので後で仕掛ける
        io.sendlineafter(PROMPT, b"set style enabled off")  # 色付け禁止
        io.sendlineafter(PROMPT, b"b fgets")
        io.sendlineafter(PROMPT, b"run")
        # 次のmemcmp呼び出し時にブレーク
        io.sendlineafter(PROMPT, b"b memcmp")
        io.sendlineafter(PROMPT, b"continue")
        # 入力 b"flag?"を待つと止まってしまったのでやめ。sendlineにする。
        io.sendline(flag_input.encode())

        for _ in range(index):
            io.sendlineafter(PROMPT, b"continue")  # N文字目比較まで飛ばす

        # memcmpでブレークしているので内容確認
        io.sendlineafter(PROMPT, b"x/16bx $rdi")
        # (gdb) x/16bx $rdi
        # 0x7fffffffe0d0: 0x7a    0xaf    0xa6    0xdb    0x59    0x10    0xbb    0x20
        # 0x7fffffffe0d8: 0xe2    0x59    0xa3    0xdb    0x4b    0x6d    0x7f    0x3f
        # (gdb)
        output = io.recvuntil(PROMPT)
        values = bytearray()
        for line in output.decode().splitlines():
            if line.startswith(PROMPT.decode()):
                continue
            # print(f"{line = }")
            for v in line.split(":\t")[1].split():
                values.append(int(v, 16))
        # print(values)
        assert len(values) == 16
        return bytes(values)


candidates = range(0x21, 0x7F)

flag = ""
for i in range(len(flag), 49):
    for c in tqdm.tqdm(candidates, leave=True):
        tmp_input = flag + chr(c)
        updated = get_updated_value(tmp_input, i)
        if updated == table[i * 16 : (i + 1) * 16]:
            flag += chr(c)
            print(flag)
            break
    else:
        raise Exception("Not found...")

実行しました:

$ time ./solve.py
 34%|████████▏               | 32/94 [00:05<00:10,  5.77it/s]
A
 34%|████████▏               | 32/94 [00:05<00:11,  5.53it/s]
 80%|███████████████████▏    | 75/94 [00:12<00:03,  5.71it/s]
Al
(中略)
Alpaca{h4sh_4lgor1thm_1s_b4s3d_0n_MD5_4nd_keccak
 79%|██████████████████▉     | 74/94 [00:15<00:04,  4.92it/s]
 98%|███████████████████████▍| 92/94 [00:17<00:00,  4.97it/s]
Alpaca{h4sh_4lgor1thm_1s_b4s3d_0n_MD5_4nd_keccak}
 98%|███████████████████████▍| 92/94 [00:17<00:00,  5.14it/s]
./solve.py  565.53s user 156.54s system 133% cpu 9:01.32 total
$

10分弱の実行で、フラグを入手できました: Alpaca{h4sh_4lgor1thm_1s_b4s3d_0n_MD5_4nd_keccak}

フラグによるとupdate関数の実装は、MD5やKeccak(本記事記述中に調べるとSHA-3の別名らしい?)を元にした処理のようです。

感想

  • Revジャンルなので頑張りましたが難しかったです!今回は1問目から難しめに感じました。
  • 2問目に5時間ほど取り組んでいましたが、残念ながら解けませんでした。
    • シェルコード内容を都度改変していく内容で、シェルコード内容を都度ダンプすることはできました。それでも全体として何をしているか解明できず、頭を唸らせているうちに終了時刻を迎えました……。