Nếu bạn có một repository trên GitHub trên máy cục bộ và muốn chạy các thí nghiệm với Azure Machine Learning, hãy làm theo các bước sau:
Bước 1: Thiết lập Azure Machine Learning Workspace
- Truy cập vào Azure Portal và tạo một Azure Machine Learning Workspace nếu bạn chưa có.
- Sử dụng Azure Machine Learning Studio để quản lý thí nghiệm của bạn.
Bước 2: Cài đặt Azure CLI và SDK
- Đảm bảo rằng bạn đã cài đặt Python trên hệ thống của mình.
- Cài đặt Azure Machine Learning Python SDK:
pip install azureml-sdk
- Cài đặt Azure CLI bằng cách làm theo hướng dẫn tại trang chính thức của Azure.
Bước 3: Chuẩn bị Repository của bạn để thực hiện thí nghiệm
- Điều hướng đến repository GitHub của bạn trên máy cục bộ.
- Thêm file
requirements.txt
để chỉ định các thư viện cần thiết và đảm bảo mã thí nghiệm của bạn được tổ chức tốt, bao gồm:- Một tập lệnh để huấn luyện mô hình của bạn (ví dụ:
train.py
). - Một tập tin cấu hình thí nghiệm (ví dụ:
experiment_config.yaml
).
- Một tập lệnh để huấn luyện mô hình của bạn (ví dụ:
- Tải file cấu hình của Workspace và đặt vào thư mục gốc.
Để lấy fileconfig.json
từ Workspace trong Azure Machine Learning:- Truy cập Azure Portal tại https://portal.azure.com.
- Nhấp vào Workspace bạn muốn làm việc (ô khoanh tròn màu vàng):

- Bấm vào nút Download config file (khoanh tròn màu tía trong hình dưới):

Bước 4: Tạo Workflow GitHub Actions (Tùy chọn)
- Nếu bạn muốn tự động hóa quy trình bằng GitHub Actions:
- Thiết lập file workflow
.yml
trong thư mục.github/workflows/
. - Sử dụng Azure Machine Learning GitHub Actions để đẩy mã của bạn và bắt đầu thí nghiệm.
- Thiết lập file workflow
Bước 5: Kết nối mã của bạn với Azure Machine Learning
- Tải mã của bạn lên Azure Workspace bằng Azure ML SDK.
Lưu ý: tránh đặt tên file làazure.py
để không bị lỗi xung đột package.
from azureml.core import Workspace, Experiment, ScriptRunConfig
# Kết nối với workspace của bạn
ws = Workspace.from_config()
# Thiết lập một thí nghiệm
experiment = Experiment(workspace=ws, name="my-experiment")
# Cấu hình tập lệnh huấn luyện
config = ScriptRunConfig(
source_directory="./",
script="train.py",
compute_target="your-compute-cluster"
)
# Gửi thí nghiệm
run = experiment.submit(config)
run.wait_for_completion()
- Lưu ý:
your-compute-cluster
là tên của cụm tính toán. Nếu bạn chưa biết cách tạo cụm tính toán, hãy đọc Hướng dẫn tạo compute cluster trong Azure ML. - Sử dụng giao diện Azure Machine Learning Studio để giám sát và quản lý thí nghiệm.
Bước 6: Theo dõi Kết quả
- Khi thí nghiệm của bạn bắt đầu, bạn có thể theo dõi nhật ký, các chỉ số và kết quả trong Azure ML Studio hoặc qua Azure CLI.
Bước 7: Xóa tài nguyên
Việc xóa tài nguyên trong Azure sau khi hoàn thành tính toán là bước quan trọng để quản lý chi phí hiệu quả và bảo mật:
- Tại sao cần xóa tài nguyên?
- Tránh phát sinh chi phí không cần thiết.
- Ngăn ngừa rủi ro bảo mật từ tài nguyên không còn được sử dụng.
- Duy trì môi trường làm việc gọn gàng và dễ quản lý.
- Cách xóa tài nguyên:
- Đăng nhập Azure Portal:
- Truy cập https://portal.azure.com và đăng nhập.
- Tìm tài nguyên cần xóa:
- Vào mục Resource Groups hoặc tìm kiếm tài nguyên cụ thể.
- Xóa tài nguyên:
- Chọn tài nguyên hoặc nhóm tài nguyên cần xóa.
- Nhấn nút Delete (Xóa) và xác nhận.
- Kiểm tra lại:
- Đảm bảo rằng tài nguyên đã được xóa hoàn toàn để không phát sinh chi phí dư thừa.