최신 Professional-Data-Engineer日本語 무료덤프 - Google Certified Professional Data Engineer Exam (Professional-Data-Engineer日本語版)

Bigtableの時系列データのホットスポットを回避するために使用する推奨される方法はどれですか?

정답: A
설명: (DumpTOP 회원만 볼 수 있음)
特定の日に雨が降るかどうかを予測するモデルを構築しています。何千もの入力特徴があり、モデルの精度への影響を最小限に抑えながら、いくつかの特徴を削除することでトレーニング速度を向上できるかどうかを確認したいと考えています。あなたは何ができますか?

정답: C
BigQuery で小売取引データを保持するデータモデルを作成しています。2 つの最大のテーブル、sales_transation_header と sales_transation_line。密結合された不変の関係があります。これらのテーブルはロード後に変更されることはほとんどなく、クエリ時に頻繁に結合されます。データ分析クエリのパフォーマンスを向上させるには、 sales_transation_header テーブルと sales_transation_line テーブルをモデル化する必要があります。
あなたは何をするべきか?

정답: A
설명: (DumpTOP 회원만 볼 수 있음)
ストリーミングAPIを介してデータがBigQueryにストリーミングされるレポートのみのデータウェアハウスを構築しています。Googleのベストプラクティスに従って、データのステージングテーブルと本番テーブルの両方があります。取り込みまたはレポート部分のパフォーマンスに影響を与えずに1つのマスターデータセット?

정답: C
あなたの会社は最近急速に成長し、以前よりも大幅に高い割合でデータを取り込むようになりました。 ApacheHadoopで毎日のバッチMapReduce分析ジョブを管理します。ただし、最近のデータの増加は、バッチジョブが遅れていることを意味しています。開発チームがコストを増やすことなく分析の応答性を高める方法を推奨するように求められました。あなたは彼らに何を勧めるべきですか?

정답: A
組織内の各分析チームは、独自のプロジェクトでBigQueryジョブを実行しています。各チームがプロジェクト内のスロット使用状況を監視できるようにする必要があります。あなたは何をするべきか?

정답: D
人間の顔が含まれているかどうかについてそれぞれラベルが付けられた画像のデータセットがあるとします。このラベル付けされたデータセットを使用して画像内の人間の顔を認識するニューラルネットワークを作成するには、どのアプローチが最も効果的である可能性がありますか?

정답: A
설명: (DumpTOP 회원만 볼 수 있음)
BigQuery にデータがあり、会社のレポートを生成するために使用されます。週次エグゼクティブ レポートの一部のフィールドが会社の標準に従った形式に対応していないことに気づきました。たとえば、レポートのエラーには、異なる電話形式や異なる国コード ID が含まれます。これは頻繁に発生する問題であるため、データを正規化するための定期的なジョブを作成する必要があります。コーディングを必要としない迅速なソリューションが必要です。どうすればよいでしょうか?

정답: C
설명: (DumpTOP 회원만 볼 수 있음)
毎日数十万のソーシャルメディアの投稿を最小のコストと最小限の手順で分析したいと考えています。
次の要件があります。
*投稿を1日1回バッチロードし、Cloud Natural LanguageAPIを介して実行します。
*投稿からトピックと感情を抽出します。
*アーカイブと再処理のために生の投稿を保存する必要があります。
*組織内外の人々と共有するダッシュボードを作成します。
分析を実行するためにAPIから抽出されたデータと、履歴アーカイブのための生のソーシャルメディア投稿の両方を保存する必要があります。あなたは何をするべきか?

정답: A
BigQueryテーブルをデータシンクとして使用したいとします。 BigQueryをシンクとして使用できる書き込みモードはどれですか。

정답: A
설명: (DumpTOP 회원만 볼 수 있음)
BigQueryからのデータのエクスポートに関するこれらのステートメントのどれが間違っていますか?

정답: A
설명: (DumpTOP 회원만 볼 수 있음)
ライブラリブックと、著者や発行年などの各ブックに関する情報を追跡するアプリケーションを、オンプレミスのデータウェアハウスからBigQueryに移行します。現在のリレーショナルデータベースでは、著者情報は別のテーブルに保持され、共通キーに関する書籍情報スキーマ設計に関するGoogleの推奨プラクティスに基づいて、借用した各書籍の著者に関するクエリの最適な速度を確保するために、データをどのように構成しますか?

정답: B
世界中の倉庫の温度データを収集するために、10,000台の新しいモノのインターネットデバイスを導入しています。これらの非常に大きなデータセットをリアルタイムで処理、保存、分析する必要があります。あなたは何をするべきか?

정답: B
ユーザーが何を食べたいかを予測する機械学習ベースの食品注文サービスのデータベーススキーマを設計しています。保存する必要のある情報の一部を次に示します。
*ユーザープロファイル:ユーザーが好きなものと嫌いなもの
*ユーザーアカウント情報:名前、住所、希望の食事時間
*注文情報:注文が行われたとき、どこから、誰に
データベースは、製品のすべてのトランザクションデータを保存するために使用されます。データスキーマを最適化する必要があります。どのGoogleCloud Platform製品を使用する必要がありますか?

정답: D

우리와 연락하기

문의할 점이 있으시면 메일을 보내오세요. 12시간이내에 답장드리도록 하고 있습니다.

근무시간: ( UTC+9 ) 9:00-24:00
월요일~토요일

서포트: 바로 연락하기