Google Cloud 認定資格 – Professional Data Engineer – 模擬問題集(全 205問)
Question 01
会社は多数のニューロンと層を持つ TensorFlow ニューラル ネットワーク モデルを構築しました。
モデルはトレーニング データによく適合しますが、新しいデータに対してテストするとパフォーマンスが低下します。
これに対処するにはどのような方法を採用できますか?
- A. スレッディング (Threading)
- B. シリアル化 (Serialization)
- C.ドロップアウト方法 (Dropout Methods)
- D. 次元削減 (Dimensionality Reduction)
Answer: C
Question 02
衣類のレコメンデーションを行うためのモデルを構築しています。
ユーザーのファッションの好みは時間の経過とともに変化する可能性が高いことがわかっているため、データ パイプラインを構築して新しいデータが利用可能になったときにモデルにストリーミングします。
このデータをどのように使用してモデルをトレーニングするべきでしょうか?
- A. 新しいデータだけでモデルを継続的に再トレーニングします。
- B. 既存のデータと新しいデータの組み合わせでモデルを継続的に再トレーニングします。
- C. 新しいデータをテスト セットとして使用しながら、既存のデータでトレーニングします。
- D. 既存のデータをテスト セットとして使用しながら、新しいデータでトレーニングします。
Answer: B
Question 03
3つのクリニックの数百人の患者をカバーするパイロット プロジェクトとして患者記録のデータベースを設計しました。
設計では、すべての患者とその訪問を表すために単一のデータベーステーブルを使用し、レポートを作成するために自己結合を使用しました。サーバーリソースの使用率は 50 %でした。その後、このプロジェクトの範囲は拡大しました。データベースには、100 倍の患者記録を保存する必要があります。レポートは、時間がかかりすぎるか、計算資源が不足してエラーが発生するため、実行できません。
データベースの設計をどのように調整すべきでしょうか?
- A. 容量 (メモリとディスク容量) をデータベース サーバーに 200 のオーダーで追加します。
- B. 日付範囲に基づいてテーブルを小さなテーブルに分割し、事前に指定された日付範囲のレポートのみを生成します。
- C. マスター患者記録テーブルを患者テーブルと来院テーブルに正規化し、自己結合を避けるために他の必要なテーブルを作成します。
- D. テーブルをクリニックごとに 1 つずつ小さなテーブルに分割します。小さいテーブル ペアに対してクエリを実行し、統合レポートにユニオンを使用します。