Hướng dẫn chạy thí nghiệm Azure Machine Learning từ GitHub repository

Nếu bạn có một repository trên GitHub trên máy cục bộ và muốn chạy các thí nghiệm với Azure Machine Learning, hãy làm theo các bước sau:


Bước 1: Thiết lập Azure Machine Learning Workspace

  • Truy cập vào Azure Portal và tạo một Azure Machine Learning Workspace nếu bạn chưa có.
  • Sử dụng Azure Machine Learning Studio để quản lý thí nghiệm của bạn.

Bước 2: Cài đặt Azure CLI và SDK

  • Đảm bảo rằng bạn đã cài đặt Python trên hệ thống của mình.
  • Cài đặt Azure Machine Learning Python SDK:
pip install azureml-sdk

Bước 3: Chuẩn bị Repository của bạn để thực hiện thí nghiệm

  • Điều hướng đến repository GitHub của bạn trên máy cục bộ.
  • Thêm file requirements.txt để chỉ định các thư viện cần thiết và đảm bảo mã thí nghiệm của bạn được tổ chức tốt, bao gồm:
    • Một tập lệnh để huấn luyện mô hình của bạn (ví dụ: train.py).
    • Một tập tin cấu hình thí nghiệm (ví dụ: experiment_config.yaml).
  • Tải file cấu hình của Workspace và đặt vào thư mục gốc.
    Để lấy file config.json từ Workspace trong Azure Machine Learning:
    • Truy cập Azure Portal tại https://portal.azure.com.
    • Nhấp vào Workspace bạn muốn làm việc (ô khoanh tròn màu vàng):
  • Bấm vào nút Download config file (khoanh tròn màu tía trong hình dưới):


Bước 4: Tạo Workflow GitHub Actions (Tùy chọn)

  • Nếu bạn muốn tự động hóa quy trình bằng GitHub Actions:

Bước 5: Kết nối mã của bạn với Azure Machine Learning

  • Tải mã của bạn lên Azure Workspace bằng Azure ML SDK.
    Lưu ý: tránh đặt tên file là azure.py để không bị lỗi xung đột package.
from azureml.core import Workspace, Experiment, ScriptRunConfig

# Kết nối với workspace của bạn
ws = Workspace.from_config()

# Thiết lập một thí nghiệm
experiment = Experiment(workspace=ws, name="my-experiment")

# Cấu hình tập lệnh huấn luyện
config = ScriptRunConfig(
    source_directory="./",
    script="train.py",
    compute_target="your-compute-cluster"
)

# Gửi thí nghiệm
run = experiment.submit(config)
run.wait_for_completion()
  • Lưu ý: your-compute-cluster là tên của cụm tính toán. Nếu bạn chưa biết cách tạo cụm tính toán, hãy đọc Hướng dẫn tạo compute cluster trong Azure ML.
  • Sử dụng giao diện Azure Machine Learning Studio để giám sát và quản lý thí nghiệm.

Bước 6: Theo dõi Kết quả

  • Khi thí nghiệm của bạn bắt đầu, bạn có thể theo dõi nhật ký, các chỉ số và kết quả trong Azure ML Studio hoặc qua Azure CLI.

Bước 7: Xóa tài nguyên

Việc xóa tài nguyên trong Azure sau khi hoàn thành tính toán là bước quan trọng để quản lý chi phí hiệu quả và bảo mật:

  • Tại sao cần xóa tài nguyên?
    • Tránh phát sinh chi phí không cần thiết.
    • Ngăn ngừa rủi ro bảo mật từ tài nguyên không còn được sử dụng.
    • Duy trì môi trường làm việc gọn gàng và dễ quản lý.
  • Cách xóa tài nguyên:
  1. Đăng nhập Azure Portal:
  2. Tìm tài nguyên cần xóa:
    • Vào mục Resource Groups hoặc tìm kiếm tài nguyên cụ thể.
  3. Xóa tài nguyên:
    • Chọn tài nguyên hoặc nhóm tài nguyên cần xóa.
    • Nhấn nút Delete (Xóa) và xác nhận.
  4. Kiểm tra lại:
    • Đảm bảo rằng tài nguyên đã được xóa hoàn toàn để không phát sinh chi phí dư thừa.


Discover more from Science Comics

Subscribe to get the latest posts sent to your email.

Leave a Reply

error: Content is protected !!