Đây là một số câu hỏi tiêu biểu trong quy trình tuyển dụng AI Engineer mà nhà tuyển dụng thường hỏi các bạn ứng tuyển. Bài viết này được tổng hợp từ nhiều nguồn khác nhau và bao gồm những gợi ý trả lời, hy vọng rằng sẽ giúp bạn nhiều trong buổi phỏng vấn sắp tới.
Mục Lục
Câu hỏi phỏng vấn tuyển dụng AI engineer
1/ Phương trình y = ax + b có mấy nghiệm?
Trả lời: Phương trình y = ax + b có vô số nghiệm
2/ Theo bạn nhược điểm lớn nhất của Linear Regression là gì?
Trả lời: Nhược điểm lớn nhất của linear regression là rất nhạy cảm với nhiễu.
3/ ReLU có ưu điểm gì và có thể thay bằng Sigmoid được hay không?
Trả lời:
a. Ưu điểm của ReLU là giảm chi phí tính toán và hạn chế được Vanishing Gradient. Về bản chất tính toán có thể thay Sigmoid bằng Gradient, nhưng thực tế ta không nên làm điều này. Bởi vì ta biết đạo hàm của Sigmoid nhỏ hơn 1 nên khi dùng Sigmoid thì rất dễ xảy ra Vanishing Gradient.
b.Tính thưa thớt (Sparsity): Hàm ReLU chỉ active các neural khi giá trị của neural >0. Chính vì thế nó sẽ tạo ra tính thưa thớt (chỉ một số neural được active) cho các neural so với hàm Sigmoid. Đồng thời tính thưa thớt tạo ra khả năng phân loại tốt hơn cho neural network.
4/ Theo bạn, Matrix giả nghịch đảo được dùng để làm gì?
Trả lời: Matrix giả nghịch đảo dùng để tìm matrix nghịch đảo, khi mà ma trận là không khả nghịch (định thức =0), hoặc không vuông.
5/ Làm sao tìm được Global Minimum khi có nhiều Local Minimum?
Trả lời: Muốn tìm Global Minimum khi có nhiều local, điều đầu tiên ta phải thêm tính năng vượt qua local minimum cho giải thuật train. Lấy ví dụ, Ta có thể dùng momentum để vượt qua local minimum. Nhưng nói đi cũng phải nói lại, ta không cố gắng tìm ra global minimum vì chi phí tính toán rất lớn. Chúng ta chỉ cần tìm local minimum nào gần với Global nhất – cái mà ta có thể chấp nhận được.
6/ Kiểm định chi-square dùng để làm gì? Nguồn gốc của phân phối chi-square?
Trả lời: Trong ML người ta dùng chi-square để chọn feature quan trọng trên dataset.
Phân phối chi-square bắt nguồn từ phân phối Z, bằng với tổng bình phương của k phân phối z (k là bậc tự do).
7/ P-value là gì? Giá trị bao nhiêu được xem là tốt? (ví dụ con số cụ thể)
Trả lời: Trị số p (p-values) là một con số xác suất, viết tắt của chữ “probability values”, cho biết giá trị kiểm định của chúng ta có đủ bằng chứng để kết luận chấp nhận hay bác bỏ giả thuyết (null hypothesis) ban đầu hay không.
P value < 0.05 có bằng chứng mạnh, bác bỏ giả thiết H0.
8/ Khi dùng CNN làm sao ta biết được nên dùng bao nhiêu layer là hợp lý?
Trả lời: Ngoài dựa vào kinh nghiệm của bản thân ta sẽ dựa vào kinh nghiệm của những người đi trước đã thực hiện trên những dữ liệu tương tự để quyết định nên dùng bao nhiêu layer.
Ta có thể tham khảo những bài toán tương tự của bản thân mà người khác đã thực hiện qua rồi, với mục đích xem cấu trúc của họ dùng các layer ra sao, sau đó áp dụng vào bài toán của mình. Cuối cùng là phải thay đổi số layer để chạy thử trên dữ liệu của mình để tìm ra số layer và cấu trúc mạng tối ưu nhất.
9/ Khi loss function giảm nhưng đôi lúc lại tăng đột ngột, Nguyên nhân của hiện tượng là gì? Cách khắc phục?
Trả lời: Hiện tượng này có thể lý giải là do có nhiều local minimum, nên loss đôi khi tăng. Tuy nhiên, xét đến tổng thể mà loss vẫn giảm thì chứng tỏ được rằng giải thuật train có khả năng vượt qua local minimum, nên có lẽ không cần cách khắc phục.
Thêm vào đó, nếu như loss bị tăng giảm thất thường rất có thể là do learning rate quá lớn. Cách khắc phục của trường hợp này là cho learning rate nhỏ lại thì sẽ không bị tăng giảm thất thường nữa mà tốc độ giảm sẽ đều.
Hy vọng rằng sau khi xem xong những câu hỏi phỏng vấn hay gặp trong quy trình tuyển dụng AI Engineer này, bạn đã chuẩn bị được vốn kiến thức vừa đủ để “vượt qua” lần phỏng vấn sắp tới. Chúc bạn thành công!
Có thể bạn quan tâm